Het talenfestival van Nederland en Vlaanderen!

Educatieve toepassingen van Nederlandse taal- en spraaktechnologie (NOTaS)/ deel II

Educatieve toepassingen van Nederlandse taal- en spraaktechnologie (NOTaS)/ deel II

Stichting NOTaS
notas logo

De NOTaS-sessies zijn onderverdeeld in twee blokken (van 13.00 tot 13.45 uur en van 14.00 tot 14.45 uur) met tussendoor een korte pauze van een kwartier die ook gelegenheid biedt om een praatje te maken met de sprekers. Het programma wordt geleid door computertaalkundige Steven Krauwer. Hij voorziet de presentaties als ervaren spreekstalmeester van een rode draad, en daagt het publiek uit om vragen te stellen, ervaringen te delen en als proefkonijn deel te nemen aan demonstraties.

Stichting NOTaS organiseert deze sessies als onderdeel van de activeiten op en rond het NOTaS Paviljoen, waar ook een groot aantal labs worden aangeboden.

Dennis de Vries van Klinkende Taal BV over Beter leren schrijven met de computer

Veel leerlingen hebben moeite met schrijfopdrachten. De oplossing is om ze hier meer mee te laten oefenen, maar wie kijkt de schrijfsels na? Taaltechnologie kan hier uitkomst bieden: Klinkende Taal ontwikkelt een applicatie die automatisch opstellen nakijkt en vervolgens verbeter­suggesties doet voor spelling, grammatica, woordkeuze en stijl. Dit moeten leerlingen in het basis- en voortgezet onderwijs en immigranten / NT2-ers in staat stellen om zelfstandig hun schrijf­vaardigheid te trainen. De spreker zal de huidige versie demonstreren en uitleggen hoe de computer een Nederlandse tekst analyseert en verbetert.

Tweede deelsessie. Voor verdere informatie, zie de uitgebreide samenvatting

Arjan van Hessen (HMI) van de Universiteit Twente over Zoeken in spraakopnames

Al een aantal jaren worden sommige hoorcolleges opgenomen en via SURF voor studenten als “Web Lectures” beschikbaar gesteld. Het idee is dat het efficiënter is om een algemeen hoorcollege op te nemen en de vrijgekomen tijd te besteden aan werkcolleges.  Door het sterk stijgend aantal beschikbare colleges wordt het steeds belangrijker dat je goed kunt zoeken in online-beschikbare opnames van colleges en kunt inzoomen op bepaalde fragmenten. In de presentatie kom je te weten hoe je zo’n systeem kunt maken en hoe goed het al werkt.

Tweede deelsessie. Voor verdere informatie, zie de uitgebreide samenvatting

Taalunieroute-Icoon

Zaterdag 1 oktober 14:00 - 15:00 Juliana 2

Steven Krauwer

was tot 1 december 2005 werkzaam bij het UiL OTS en het IVT als docent-onderzoeker op het gebied van de computationele taalkunde en taaltechnologie. Sinds die datum is hij aan het UiL OTS verbonden als 'affiliate researcher' op hetzelfde vakgebied. Zijn onderzoeks­belangstelling gaat vooral uit naar multilingualiteit (automatisch vertalen) en language resources.

Sinds 2005 was Steven Krauwer ook als grondlegger en directeur betrokken bij de opzet en uitvoering van CLARIN.NL, het taaltechnologische infrastructuurprogramma voor de taaltechnologische ontsluiting van bronnen in de humaniora. Verder is hij actief in het Europese Netwerk voor Taal- en Spraaktechnologie ELSNET en de Foundation for Endangered Languages (FEL).

Dennis de Vries van Klinkende Taal BV over Beter leren schrijven met de computer

Klinkende Taal helpt bij het beter leren schrijven. Hiervoor ontwikkelt Klinkende Taal een educatieve applicatie die automatisch opstellen kan nakijken en didactisch verantwoorde verbeter¬suggesties doet voor spelling, grammatica, woordkeuze en stijl. Zo kunnen leerlingen in het basis- en voortgezet onderwijs en studenten van NT2-opleidingen zelfstandig hun schrijfvaardigheid trainen.

In de presentatie maak je kennis met de taaltechnologie die de basis vormt van het analyseproces achter Klinkende TaalDennis de Vries MSc legt eerst uit hoe de computer een tekst ontleedt, door dit stap voor stap met een Nederlandse tekst te demonstreren. Hierbij introduceert hij algemene technieken als tokenizen, lemmatizentaggen en parseren, wat vaktermen zijn voor vaardigheden die je bekend voor zullen komen uit de grammaticales. Zo begrijp je beter hoe een computer mensen kan helpen om beter te (leren) schrijven, en wat zijn sterke en zwakke punten zijn.

Vervolgens krijg je te zien hoe Klinkende Taal chocola maakt van een ingewikkelde ambtelijke tekst vol lange, passieve zinnen en ingewikkelde woorden. Hierbij krijg je de kans om je met de computer te meten door zelf taalniveaus te schatten, problemen aan te wijzen en herschrijf-suggesties te doen. Tot slot wordt toegelicht hoe Klinkende Taal de leraar ondersteunt bij het nakijken van schoolopstellen. Dennis gaat hierover graag met de zaal in gesprek!

Dennis de Vries studeerde Kunstmatige Intelligentie aan de Rijksuniversiteit Groningen. Tijdens zijn studie werkte hij onder andere mee aan de ontwikkeling van Alpino, een geavanceerde syntactische parser voor het Nederlands. Na zijn studie werd hij developer taaltechnologie bij het Amsterdamse IT-bedrijf GridLine, de leverancier van Klinkende Taal. Klinkende Taal helpt bij het schrijven van begrijpelijke teksten in het Nederlands.

De Vries is nauw betrokken bij de ontwikkeling en levering van Klinkende Taal, in het bijzonder de backend en de Office-plugins. Hij werkt ook mee aan de ontwikkeling van correctheidscontroles, SonaLing (controles voor andere talen) en Klinkende Taal Educatief. Deze toepassing moet scholieren, studenten en NT2-ers (bv. expats) helpen om beter te leren schrijven. Tot slot verzorgt Dennis regelmatig  publiekspresentaties over Klinkende Taal en verwante toepassingen als spellingcontrole en terminologie-extractie.

Arjan van Hessen (HMI) van de Universiteit Twente over Zoeken in spraakopnames

Al een aantal jaren worden sommige hoorcolleges opgenomen en via SURF voor studenten als Web Lectures beschikbaar gesteld. Het idee is dat het efficiënter is om een algemeen hoorcollege op te nemen en de vrijgekomen tijd te besteden aan werkcolleges. Studenten worden dan geacht dit hoorcollege al bekeken te hebben voor ze aan het werkcollege deelnemen. Verder kunnen opgenomen colleges gebruikt worden als achtergrond/lesmateriaal bij bepaalde colleges.

Maar door het sterk stijgend aantal beschikbare colleges wordt het steeds belangrijker dat je goed kunt zoeken in die opgenomen colleges en vervolgens kunt besluiten alleen bepaalde fragmenten van het college te bekijken. Stel het college gaat over Koken in de Late Middeleeuwen en er wordt in zes verschillende Web Lectures iets over gezegd, dan wil je wel die stukjes bekijken die over dat onderwerp gaan, maar niet die zes verschillende Web Lectures in z’n geheel bekijken.

Omdat de universiteiten steeds meer tweetalig worden, wordt ook bekeken hoe we zowel in het Nederlands als het Engels kunnen zoeken in Nederlands en Engels gesproken Web Lectures.

Samen met SURF wordt er momenteel gewerkt aan zo’n ontsluitingssysteem waarbij er in principe op zowel woorden als hoofdstukken/beschrijvingen gezocht kan worden. In de presentatie wordt uitgelegd hoe je zo’n systeem kunt maken, zonder al te diep op de achterliggende spraak- en taaltechnologie in te gaan. Eén en ander zal aanschouwelijk worden gemaakt met echte voorbeelden.

Arjan van Hessen

Arjan van Hessen studeerde geofysica (seismiek) en Italiaanse taal en cultuur aan de Universiteit Utrecht. In 1992 promoveerde hij aan de Universiteit Utrecht op een fonologisch onderzoek. In de jaren werkte hij als onderzoeker aan verschillende universiteiten (Düsseldorf, Ulm, Utrecht) en bij Lernout&Hauspie in België (1995 – 1997). Uiteindelijk kreeg hij een onderzoeksaanstelling bij de vakgroep TKI (Taal, Kennis en Informatica) van de Universiteit Twente, aanvankelijk in combinatie met een parttime-functie bij Comsys.

Sinds 2002 is Van Hessen “Head of Imagination” bij het Enschedese bedrijf TeleCats (marktleider voor spraakgestuurde telefonie-applicaties). In 2005 raakte hij betrokken bij het STEVIN-programma en in 2009 bij CLARIN.NL, het infrastructuurprogramma voor de Geesteswetenschappen, en het hierop volgende CLARIAH-project. Dit resulteerde in een deeltijd-aanstelling aan de Universiteit Utrecht. Hiernaast is Van Hessen al jaren actief in het bestuur van Stichting NOTaS (Nederlandse Organisatie van Taal en Spraaktechnologie).