5–7 grudnia 2025
D20
Europe/Warsaw strefa czasowa

Między wierszami - jak model LDA ujawnia prawdziwą tematykę w erze nadmiaru tekstu

6 gru 2025, 10:30
30min
10A (D20)

10A

D20

Janiszewskiego 8, 50-372 Wrocław
wykład Matematyka stosowana Sesja matematyki stosowanej

Mówca

Wiktor Waksmundzki (Politechnika Krakowska im. Tadeusza Kościuszki, Wydział Informatyki i Matematyki, SKN Matematyków)

Opis

W dobie nadmiaru informacji i łatwości publikacji treści efektywne określenie
głównej tematyki dużych zbiorów tekstowych staje się wyzwaniem. W takim
przypadku tradycyjna analiza jest czasochłonna i nieefektywna. Odpowiedzią na
to wyzwanie są nowoczesne metody analizy tekstu, w tym model ukrytej alokacji
Dirichleta (LDA – Latent Dirichlet Allocation), który pozwala na identyfikację
ukrytych tematów na podstawie rozkładów prawdopodobieństwa współwystę-
powania słów. Dzięki wykorzystaniu języków programowania takich jak Python
czy R możliwe jest zautomatyzowanie tego procesu i przeprowadzenie analizy
nawet na bardzo dużych zbiorach danych. W referacie przedstawiono ogólne
założenia modelu LDA, jego implementację oraz przykładowe wyniki analizy
tematycznej przeprowadzonej na wybranym korpusie tekstów. Uzyskane wyniki potwierdzają przydatność tego podejścia w eksploracji danych tekstowych
i identyfikacji dominujących tematów badawczych.

Główny autor

Wiktor Waksmundzki (Politechnika Krakowska im. Tadeusza Kościuszki, Wydział Informatyki i Matematyki, SKN Matematyków)

Dokumenty prezentacyjne

Jeszcze nie ma materiałów.

Obrady