Sök:

Tremänning eller syssling

Automatisk sökning i bloggar efter ordisoglosser i Sverige


Ibland används i två dialekter olika ord för samma sak. Syftet med denna studie är att visa vad somkan automatiseras i sökandet efter ord-isoglosser. Detta undersöks genom att skriva och utvärdera ettprogram som genom att analasyera bloggtext söker efter ordisoglosser i Sverige. En isogloss är engeografisk gräns mellan två olika språkliga egenskaper, till exempel prosodi eller betoning, eller som idetta fall ord. Programmet mappar skribentens kommun till orden från bloggtexterna i en databas. Lagttill detta låter programmet användaren söka efter antingen hur vanligt ett ord är i Sveriges kommunerjämfört med riksgenomsnittet; eller vilket av två olika ord som är vanligast inom varje kommun, enligtett två-sidigt proportionstest. Resultatet av de gjorda sökningarna skrevs till en fil och plottades sedanmanuellt. Utvärderingen visar att programmet kan hitta några ordisoglosser mellan kommuner, och attkartorna i viss utsträckning stämmer överrens med de resultat som Parkvall (Parkvall, 2011; Parkvall,2012) påvisar. Detta indikerar att programmet är en bra början för liknande studier. Förbättringar avprogrammet är att användaren tillåts använda reguljära uttryck för att få bort ambuigitet.

Författare

Johan Engdahl

Lärosäte och institution

Stockholms universitet/Avdelningen för datorlingvistik

Nivå:

"Kandidatuppsats". Självständigt arbete (examensarbete ) om minst 15 högskolepoäng utfört för att erhålla kandidatexamen.

Läs mer..