Teljes kurzus

Szövegbányászat R-ben: Egy 10 alkalmas kurzus

Ezen az oldalon ízelítőt adunk a szövegbányászat kutatási alkalmazásaiból. A 10 alkalmas kurzus bevezetést nyújt az R-ben végrehajtott szövegbányászati és gépi tanulási feladatokba. A feladatok elvégzéséhez a Hungarian Comparative Agendas Project korpuszait használjuk. A kurzus elvégzéséhez fontos az R és az RStudio minimális ismerete. A telepítésről további információ itt. Az R-ről itt, az RStudio-ról pedig itt található egy rövid leírás.

ÁTTEKINTÉS

1. Mi a szövegbányászat? A szöveg mint adat

2. A korpusz-készítés és előkészítés problémái

3. Egyszerű leíró statisztikák: szózsák, együttes megjelenés

4. Névelem-felismerés 

5. Osztályozás: érzelem-felismerés

6. Osztályozás: további szótár-alapú feladatok

7. Osztályozás: felügyelt tanulás 

8. Csoportosítás: klaszter-elemzés

9. Csoportosítás: topic modellezés

10. Egy teljes kutatás áttekintése