Startsida
Hjälp
Sök i LIBRIS databas

     

 

Sökning: onr:22278211 > A Persian Treebank ...

A Persian Treebank with Stanford Typed Dependencies [Elektronisk resurs]

Seraji, Mojgan (författare)
The 9th International Conference on Language Resources and Evaluation (LREC), 2014, 26-31 May, Reykjavik, Iceland 
Jahani, Carina (författare)
Megyesi, Beata (författare)
Nivre, Joakim (författare)
Uppsala universitet Humanistisk-samhällsvetenskapliga vetenskapsområdet (utgivare)
datorlingvistik (medarbetare)
iranistik (medarbetare)
datorlingvistik (medarbetare)
2014
Engelska.
Ingår i: Proceedings of Language Resources and Evaluation. ; 796-801
Läs hela texten
Läs hela texten
  • E-bok
Sammanfattning Ämnesord
Stäng  
  • We present the Uppsala Persian Dependency Treebank (UPDT) with a syntactic annotation scheme based on Stanford Typed Dependencies. The treebank consists of 6,000 sentences and 151,671 tokens with an average sentence length of 25 words. The data is from different genres, including newspaper articles and fiction, as well as technical descriptions and texts about culture and art, taken from the open source Uppsala Persian Corpus (UPC). The syntactic annotation scheme is extended for Persian to include all syntactic relations that could not be covered by the primary scheme developed for English. In addition, we present open source tools for automatic analysis of Persian containing a text normalizer, a sentence segmenter and tokenizer, a part-of-speech tagger, and a parser. The treebank and the parser have been developed simultaneously in a bootstrapping procedure. The result of a parsing experiment shows an overall labeled attachment score of 82.05% and an unlabeled attachment score of 85.29%. The treebank is freely available as an open source resource. 

Ämnesord

Natural Sciences  (hsv)
Computer and Information Sciences  (hsv)
Language Technology (Computational Linguistics)  (hsv)
Naturvetenskap  (hsv)
Data- och informationsvetenskap  (hsv)
Språkteknologi (språkvetenskaplig databehandling)  (hsv)
Computational Linguistics  (uu)
Datorlingvistik  (uu)
Iranska språk  (uu)
Iranian Languages  (uu)

Indexterm och SAB-rubrik

treebank
Persian
Stanford Typed Dependencies
Inställningar Hjälp

Uppgift om bibliotek saknas i LIBRIS

Kontakta ditt bibliotek, eller sök utanför LIBRIS. Se högermenyn.

Om LIBRIS
Sekretess
Hjälp
Fel i posten?
Kontakt
Teknik och format
Sök utifrån
Sökrutor
Plug-ins
Bookmarklet
Anpassa
Textstorlek
Kontrast
Vyer
LIBRIS söktjänster
SwePub
Uppsök

Kungliga biblioteket hanterar dina personuppgifter i enlighet med EU:s dataskyddsförordning (2018), GDPR. Läs mer om hur det funkar här.
Så här hanterar KB dina uppgifter vid användning av denna tjänst.

Copyright © LIBRIS - Nationella bibliotekssystem

 
pil uppåt Stäng

Kopiera och spara länken för att återkomma till aktuell vy