niedziela, 15 grudnia 2013

Narzędzie TI nr 3

Trudno jest mi naprawdę cokolwiek Wam sugerować, ponieważ wiem jak mało osób zajmuje się językiem dawnym...  Dla porównania niektórych zasobów leksykalnych języka XVIII w. ze współczesnym pomocne mogą być różnego rodzaju korpusy językowe. Niestety nie istnieje korpus wieku, który mnie interesuje. Mimo to w pewnych kwestiach można odnaleźć tam rozwiązanie...
Może na początek o samym KORPUSIE :
"Korpus językowy to zbiór tekstów, w którym szukamy typowych użyć słów i konstrukcji oraz innych informacji o ich znaczeniu i funkcji. Bez dostępu do korpusu nie da się dziś prowadzić badań językoznawczych, pisać słowników ani podręczników języków obcych, tworzyć wyszukiwarek uwzględniających polską odmianę, tłumaczy komputerowych ani innych programów zaawansowanej technologii językowej. Korpus jest niezbędny do pracy językoznawcom, ale korzystają zeń często także informatycy, historycy, bibliotekarze, badacze literatury i kultury oraz specjaliści z wielu innych dziedzin humanistycznych i informatycznych."

a to link (http://nkjp.pl/) i widok stronki:
pl en
NKJP logo
Narodowy Korpus Języka Polskiego
konsorcjum
IPI PAN PWN UŁ IJP PAN

O projekcie NKJP

Korpus językowy to zbiór tekstów, w którym szukamy typowych użyć słów i konstrukcji oraz innych informacji o ich znaczeniu i funkcji. Bez dostępu do korpusu nie da się dziś prowadzić badań językoznawczych, pisać słowników ani podręczników języków obcych, tworzyć wyszukiwarek uwzględniających polską odmianę, tłumaczy komputerowych ani innych programów zaawansowanej technologii językowej. Korpus jest niezbędny do pracy językoznawcom, ale korzystają zeń często także informatycy, historycy, bibliotekarze, badacze literatury i kultury oraz specjaliści z wielu innych dziedzin humanistycznych i informatycznych.
Swoje korpusy narodowe mają już BrytyjczycyNiemcyCzesi iRosjanie. Także Polakom potrzebny jest wielki, zrównoważony gatunkowo i tematycznie, korpus językowy – internetowy skarbiec polszczyzny.
Narodowy Korpus Języka Polskiego jest wspólną inicjatywą Instytutu Podstaw Informatyki PAN (koordynator), Instytutu Języka Polskiego PAN,Wydawnictwa Naukowego PWN oraz Zakładu Językoznawstwa Komputerowego i Korpusowego Uniwersytetu Łódzkiego, zrealizowaną jako projekt badawczy rozwojowy Ministerstwa Nauki i Szkolnictwa Wyższego.
Te cztery instytucje wspólnie zbudowały korpus referencyjny polszczyzny wielkości ponad półtora miliarda słów. Wyszukiwarki korpusowe (menu po prawej stronie) pozwalają przeszukiwać zasoby NKJP zaawansowanymi narzędziami uwzględniającymi odmianę polskich wyrazów, a nawet analizującymi budowę polskich zdań.
Lista źródeł korpusu zawiera nie tylko klasykę literatury polskiej, ale też prasę codzienną i specjalistyczną, nagrania rozmów, teksty ulotne i internetowe. Zróżnicowanie tematyczne i gatunkowe tekstów, dbałość o reprezentację rozmówców obu płci, w różnym wieku i z różnych regionów, są dla wiarygodności korpusu równie ważne jak jego wielkość.
Zachęcamy wszystkich do korzystania z Narodowego Korpusu Języka Polskiego.
© Narodowy Korpus Języka Polskiego 2008-2012
Praca naukowa finansowana ze środków na naukę
w latach 2007-2012 jako projekt rozwojowy.
design by enkrotka

Brak komentarzy:

Prześlij komentarz