Predavanje u na temu analize sentimenta teksta u R-u održaće se 18. marta u Startit Centru u Beogradu sa početkom u 18h.
Meetup će biti posvećen uvodu u analizu sentimenta (emotivnog tona) teksta na engleskom jeziku u programskom jeziku R. Principe analize sentimenta ćemo diskutovati kroz minimalnu studiju slučaja predstavljanja tri tehnološka giganta - Apple, Samsung, i Huawei - u onaljn vestima na engleskom jeziku tokom januara i februara 2020.
Oslonićemo se na paket {newsrivr} kako bismo preko Newsriver API pretrage prikupili vesti koje nas interesuju. Pokazaćemo kako jednostavno pre-procesiranje teksta za analizu možemo da izvedemo kombinujući funkcije paketa {tidytext} i {dplyr}. U samoj analizi sentimenta prikupljenih tekstova oslonićemo se na Bing sentiment leksikon koji je dat u paketu {textdata}. Sve vizuelizacije radimo u {ggplot2} dok izveštaj o analizi reprodukujemo u R Markdоwn tokom samog meetupa. Konačno, primenom bejzijanskih A/B testova testitamo hipoteze o tome da li je sentiment bio pozitivniji ili ne u kontekstu vesti dobijenih pretragom za Apple, Samsung, i Huawei.
Meetup je namenjen svim entuzijastima u programskom jeziku R, profesionalcima u Data Science koji žele da steknu uvid u analizu sentimenta teksta, kao i publici koju interesuje mašinska analiza teksta uopšte. Mnogi detalji na koje moramo da obratimo pažnju u razvoju pravih sistema za NLP i analizu sentimenta neće biti obuhvaćeni studijom slučaja koju smo pripremili i njima ćemo posvetiti pažnju na kraju diskusije. Cilj je, pre svega, da se zainteresovani steknu uvid u korake i principe u analizi sentimenta teksta, a R programeri dobiju kod i objašnjenje od koga mogu da počnu i uče dalje ako su zainteresovani.
Predavač će biti dr Goran S. Milovanović, vlasnik konsultantske agencije DataKolektiv i Data Scientist za Wikidata u Wikimedia Deutschland.
Svi materijali su dostupni na GitHub-u.
Prisustvo predavanju je besplatno ali je neophodno prijaviti se putem linka.
0 komentara