Lingwistyka korpusowa
Informacje ogólne
Kod przedmiotu: | 3223-LK-OG |
Kod Erasmus / ISCED: |
09.0
|
Nazwa przedmiotu: | Lingwistyka korpusowa |
Jednostka: | Instytut Komunikacji Specjalistycznej i Interkulturowej |
Grupy: |
Przedmioty ogólnouniwersyteckie humanistyczne Przedmioty ogólnouniwersyteckie Instytutu Komunikacji Specjalistycznej i Interkulturowej Przedmioty ogólnouniwersyteckie na Uniwersytecie Warszawskim |
Punkty ECTS i inne: |
2.00
LUB
3.00
(zmienne w czasie)
|
Język prowadzenia: | polski |
Rodzaj przedmiotu: | ogólnouniwersyteckie |
Założenia (opisowo): | Student powinien posiadać podstawową wiedzę o języku polskim, wskazana wiedza z podstaw obsługi komputera oraz instalacji oprogramowania. |
Tryb prowadzenia: | w sali |
Skrócony opis: |
Przedmiot przeznaczony jest dla studentów zainteresowanych podniesieniem swoich kompetencji językowych oraz rozpoznawaniem na podstawie prostych wskaźników stylu i intencji twórcy danego tekstu. Może także służyć poznaniu językowego obrazu danej osoby/ zjawiska/ problemu/ stereotypu w społeczeństwie komunikacyjnym lub przydać się w badaniu jakości tłumaczeń tekstów. Rozwija też kompetencje w zakresie prostych narzędzi informatycznych dostępnych w sieci. Umiejętności można zastosować też dla uatrakcyjnienia badań z innych przedmiotów lub wzmocnienia treści pracy dyplomowej. Preferowany projekt końcowy, przygotowywany w trakcie zajęć może posłużyć do dalszego wykorzystania. Możliwe jest też zaliczenie przedmiotu w formie testu (częściowo) otwartego z materiału przedstawianego na zajęciach i w wybranej literaturze. Na zajęciach omawiane są wybrane programy do analizy tekstów, tworzenia i oceny korpusów tekstowych, programy stylometryczne, i elektroniczne korpusy tekstowe. |
Pełny opis: |
Program kursu obejmuje wiadomości teoretyczne dotyczące budowy korpusów językowych, technik gromadzenia danych językowych oraz możliwości ich praktycznego wykorzystania: 1. Pojęcie korpusu językowego. Korpus językowy a zbiór tekstów. Badania teoretyczne a materiałowe: rola danych językowych w naukach społecznych, marketingu, mediach oraz językoznawstwie. 2. Typologia korpusów: korpusy jedno i wielojęzyczne, równoległe i porównywalne. Pojęcie reprezentatywności i adekwatności korpusów. 3. Podstawowe informacje na temat indeksacji korpusów językowych; umiejętności interpretacji podanych danych. 4. Podstawowe korpusy języka polskiego. Korpus NKJP wraz z narzędziami towarzyszącymi. 5. Dostępne narzędzia analizy korpusów tekstowych (AntConc, Jasnopis i in.). 6. Narzędzia analizy parametrycznej tekstu, zastosowania praktyczne pomiaru modalności tekstu. 7. Możliwe zastosowania korpusów w praktyce: a) badanie języków specjalistycznych b) korpus jako narzędzie wspomagające tłumacza c) dydaktyka języków obcych d) słowniki i modele słowników na różnych nośnikach danych 8. Korpusy tekstowe i teksty równoległe w pracy z programami wspomagającymi proces tłumaczenia (narzędzia CAT). Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi pozwalającymi dowiedzieć się więcej o potrzebnym nam tekście, zanalizować statystycznie i stylometrycznie jego treść i wykorzystać miarodajne dane dla własnych celów (badawczych). Student po kursie powinien posługiwać się podstawowymi programami z zakresu lingwistyki cyfrowej oraz wyszukiwać potrzebne dane przy pomocy poznanych narzędzi. Kurs prowadzony z użyciem prezentacji i wizualizacji działania poszczególnych programów, w miarę dostępnych możliwości sprzętowych. Ponadto, kurs zakłada zdobycie umiejętności wyprowadzania indywidualnych wniosków z prowadzonych analiz lingwistycznych oraz ich wizualizacji. Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach projektu korpusu tekstowego, stanowiącego podstawę zaliczenia (projekt lub nabyte umiejętności można zastosować dla uatrakcyjnienia badań z innych przedmiotów lub wzmocnienia treści pracy dyplomowej). Alternatywnie można zaliczyć przedmiot prezentując wiedzę przedmiotową na teście zaliczeniowym z treści zajęć i literatury. Nakład pracy studenta (3 ECTS): 30 godzin obecność na zajęciach w sali (1) 30 godzin przygotowanie korpusu tekstowego lub opracowań alternatywnych (1) 15 godzin praca własna z oprogramowaniem (0,5) 15 godzin lektura i przygotowanie do zajęć, przygotowanie do egzaminu/omówienia projektu (0,5) |
Literatura: |
Literatura podstawowa: - Gruszczyńska E., Leńko-Szymanska A. (red.), Polskojęzyczne korpusy równoległe / Polish-language Parallel Corpora, WLS UW, Warszawa, 2016. - Karpiński Ł., Systemy leksykalno-komunikacyjne, Campidoglio, Warszawa, 2017. - Karpiński Ł., 2017, Maszynowa charakterystyka tekstów specjalistycznych na potrzeby terminologicznych baz danych, [w:] "Komunikacja Specjalistyczna", t. 14/2017, s. 139-163. - "Prace filologiczne", tom. LXIII, WP UW, Warszawa 2012 (tom zawierający zbiór prac dot. lingwistyki korpusowej) Literatura uzupełniająca: - Biber C., Corpus Linguistics. Investigating language structure and use, Cambridge Univesrity Press 1998. - Celiński P., 2013a, Postmedia. Cyfrowy kod i bazy danych, Wydawnictwo UMCS, Lublin. - Hebal-Jezierska M., Podstawowe zasady korzystania z korpusów przy badaniu języka, [w:] "Prace Etnograficzne", 2018, Tom 46, Numer 1, s. 30-49 - Kamińska-Szmaj I., 1989, Słownictwo tekstów popularnonaukowych w ujęciu statystycznym, [w:] „Rozprawy Komisji Językowej”, t. XVI, Wrocławskie Towarzystwo Naukowe, Wyd. PAN, Wrocław, s. 69-87. - Karpiński Ł., Zarys leksykografii terminologicznej, KJS UW, Warszawa, 2008 - Karpiński Ł., 2009a, Wybrane założenia komputerowej analizy tekstów i gromadzenia danych, [w] „Języki Specjalistyczne 9 – Kulturowy i leksykograficzny obraz języków specjalistycznych”, (red. eidem), KJS UW, Warszawa - Karpiński Ł., 2012a, Analiza parametryczna tekstu a translacja maszynowa – wybrane zagadnienia, [w] „The Linguistic Journal of Applied Linguistics”, (red.), Lingwistyczna Szkoła Wyższa w Warszawie, Warszawa. - Karpiński Ł., Michałowski P., 2012, Wybrane metody analizy terminologii specjalistycznej (na przykładzie technolektu geografii), [w:] „Edukacja dla Przyszłości”, t. IX, 2012, Wydawnictwo Wyższej Szkoły Finansów i Zarządzania w Białymstoku, Białystok, s. 19-46. - Lewandowska-Tomaszczyk B., Gramatyka angielska na autentycznych materiałach językowych, Łódź, WSSM 2004. - Lewandowska-Tomaszczyk B., Podstawy językoznawstwa korpusowego, Wyd. Uniwersytetu Łódzkiego, Łódź 2005. - Ludskanow A., 1973, Tłumaczy człowiek i maszyna cyfrowa, WNT, Warszawa - McEnery T., Wilson A., Corpus Linguistics: an Introduction, Edinburgh : Edinburgh University Press, 2001 - Pawłowski A., 2001, Metody kwantytatywne w sekwencyjnej analizie tekstu, Uniwersytet Warszawski Katedra Lingwistyki Formalnej, Warszawa. - Przepiórkowski A., Bańko M., Górski R., Lewandowska-Tomaszczyk B., Narodowy Korpus Języka Polskiego, PWN, Warszawa 2012 - Sambor J., 1969, Badania statystyczne nad słownictwem. Na materiale „Pana Tadeusza”, Wrocław-Warszawa. - Świdziński M., 2006, Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, [w:] „LingVaria”, nr 1, Wydział Polonistyki UJ, Kraków. - Tognini-Bonelli E., Corpus Linguistics at Work, John Benjamins, Amsterdam/Philadelphia 2001 Materiały autorskie prowadzącego, zbiory analiz, wizualizacje danych stylometrycznych. |
Efekty uczenia się: |
Student w zakresie poniższych kryteriów podwyższa kwalifikacje: zna terminologię stosowaną w językoznawstwie i dziedzinach pokrewnych na poziomie rozszerzonym, orientuje się w najważniejszych kierunkach i metodach badań lingwistycznych; rozumie terminologię gramatyczną; posiada wiedzę na temat wybranych uwarunkowań pragmatycznych danych systemów językowych; ma pogłębioną wiedzę na temat metodologii i prowadzenia badań językoznawczych lub literackich; zna styl naukowy i leksykę naukową; ma wiedzę na temat baz danych dla lingwistyki, posiada podstawową wiedzę na temat interpretacji danych pozyskanych z analiz; zna popularne programy komputerowe wspomagające pracę tłumacza (CAT) oraz wybrane programy do analizy frekwencyjnej i stylometrycznej; zna możliwości wykorzystania tłumaczenia maszynowego; Umiejętności: wykorzystuje programy komputerowe przydatne w pracy tłumacza, potrafi właściwie formatować tekst w języku polskim, oraz w przynajmniej jednym w języku obcym; sprawnie posługuje się arkuszami kalkulacyjnymi i wykresami; potrafi korzystać z ogólnie dostępnych naukowych baz danych (w tym baz terminologicznych i korpusowych); sprawnie wyszukuje informacje, korzysta z wiedzy eksperckiej, ze słowników encyklopedycznych, językowych, terminologicznych ogólno-naukowych, ogólno-technicznych, interdyscyplinarnych i branżowych, korpusów językowych, baz danych, tekstów paralelnych; potrafi wskazać luki w badaniach naukowych i kierunki ich kontynuowania; formułuje problemy badawcze, dobiera adekwatne metody, konstruuje narzędzia badawcze, opracowuje, prezentuje i interpretuje wyniki badań, wyciąga wnioski; Kompetencje społeczne: potrafi uzupełniać i doskonalić nabytą wiedzę o przynajmniej jednym języku specjalności oraz o własnym języku; jest świadomy konieczności ciągłego poszukiwania nowych źródeł słownikowych i tekstowych, a także śledzenia współcześnie powstających teorii naukowych; szybko reaguje na zmieniającą się rzeczywistość; wyciąga wnioski z informacji zwrotnych, umie zarządzać czasem; utrzymuje kontakt ze środowiskiem tłumaczy, pracuje w środowisku wielokulturowym; zna środowisko pracy tłumacza; potrafi pracować w grupie, współpracować z innymi, przyjmując odpowiednie role (funkcje); kierować małym zespołem (3-4 osoby w grupach ćwiczeniowych); |
Metody i kryteria oceniania: |
Metody oceny pracy studenta - ocena aktywności i bieżące przygotowanie do zajęć; - projekt (tematyczny korpus tekstowy lub alternatywa); - końcowe zaliczenie pisemne (test lub analiza stylometryczna korpusu). Kryteria oceniania (komponenty oceny końcowej): - ocena ciągła z zajęć: 10% - projekt (tematyczny korpus tekstowy): 40% - zaliczenie końcowe: 50% Egzamin (zaliczenie końcowe): W przypadku testu mieszanego (wielokrotnego i/lub jednokrotnego wyboru) wiążąca jest liczba uzyskanych punktów. W przypadku przygotowywania projektu analizy wybranych korpusów tekstowych wiążąca jest liczba uzyskanych punktów za poszczególne części opracowania. Zasady punktacji dla oceny bieżącej i egzaminu/zaliczenia: 55%-69% = 3 70%-74% = 3+ 75%-84% = 4 85%-89% = 4+ 90%-100% = 5 Zasady współpracy prowadzącego ze studentami: 1. Nieobecności – dopuszczalne 3 nieusprawiedliwione nieobecności w semestrze (jest to zgodne z regulaminem). 2. Do końcowego zaliczenia można podejść po zaliczeniu projektu (zadania) oraz otrzymania pozytywnej oceny ciągłej zajęć. 3. Student ma prawo do dwukrotnej poprawy każdego sprawdzianu pisemnego. Nieprzystąpienie do sprawdzianu w pierwszym terminie bez usprawiedliwienia powoduje utratę tego terminu. |
Zajęcia w cyklu "Semestr zimowy 2023/24" (zakończony)
Okres: | 2023-10-01 - 2024-01-28 |
Przejdź do planu
PN WT KON
ŚR CZ PT |
Typ zajęć: |
Konwersatorium, 30 godzin, 16 miejsc
|
|
Koordynatorzy: | Łukasz Karpiński | |
Prowadzący grup: | Łukasz Karpiński | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Konwersatorium - Zaliczenie na ocenę |
|
Skrócony opis: |
Przedmiot przeznaczony jest dla studentów zainteresowanych podniesieniem swoich kompetencji językowych oraz rozpoznawaniem na podstawie prostych wskaźników stylu i intencji twórcy danego tekstu. Może także służyć poznaniu językowego obrazu danej osoby/ zjawiska/ problemu/stereotypu w społeczeństwie komunikacyjnym lub przydać się w zakresie badania tłumaczeń tekstów z/na języki obcych. Rozwija także kompetencje w zakresie prostych narzędzi informatycznych, dostępnych w sieci. Nabyte umiejętności można zastosować dla uatrakcyjnienia badań z innych przedmiotów lub wzmocnienia treści pracy dyplomowej. Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi tworzenie ukierunkowanych korpusów tekstowych badających zadany problem. Na zajęciach omawiane są wybrane programy do analizy tekstów, tworzenia i oceny korpusów tekstowych, programy stylometryczne, i elektroniczne korpusy tekstowe. Nabyta wiedza ma posłużyć do stworzenia przez studenta (lub grupę studentów) określonego projektu korpusowego. |
|
Pełny opis: |
Zgodnie z opisem nadrzędnym. |
|
Literatura: |
Zgodnie z opisem nadrzędnym. |
|
Uwagi: |
W przypadku braku możliwości prowadzenia zajęć w formie stacjonarnej zajęcia będą odbywać się przy użyciu narzędzi komunikacji na odległość, najprawdopodobniej Google Meet oraz innych zalecanych przez UW. |
Zajęcia w cyklu "Semestr letni 2024/25" (jeszcze nie rozpoczęty)
Okres: | 2025-02-17 - 2025-06-08 |
Przejdź do planu
PN KON
WT ŚR CZ PT |
Typ zajęć: |
Konwersatorium, 30 godzin, 20 miejsc
|
|
Koordynatorzy: | Łukasz Karpiński | |
Prowadzący grup: | Łukasz Karpiński | |
Lista studentów: | (nie masz dostępu) | |
Zaliczenie: |
Przedmiot -
Zaliczenie na ocenę
Konwersatorium - Zaliczenie na ocenę |
|
Skrócony opis: |
Przedmiot przeznaczony jest dla studentów zainteresowanych podniesieniem swoich kompetencji językowych oraz rozpoznawaniem na podstawie prostych wskaźników stylu i intencji twórcy danego tekstu. Może także służyć poznaniu językowego obrazu danej osoby/ zjawiska/ problemu/stereotypu w społeczeństwie komunikacyjnym lub przydać się w zakresie badania tłumaczeń tekstów z/na języki obcych. Rozwija także kompetencje w zakresie prostych narzędzi informatycznych, dostępnych w sieci. Nabyte umiejętności można zastosować dla uatrakcyjnienia badań z innych przedmiotów lub wzmocnienia treści pracy dyplomowej. Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi tworzenie ukierunkowanych korpusów tekstowych badających zadany problem. Na zajęciach omawiane są wybrane programy do analizy tekstów, tworzenia i oceny korpusów tekstowych, programy stylometryczne, i elektroniczne korpusy tekstowe. Nabyta wiedza ma posłużyć do stworzenia przez studenta (lub grupę studentów) określonego projektu korpusowego. |
|
Pełny opis: |
Zgodnie z opisem nadrzędnym. |
|
Literatura: |
Zgodnie z opisem nadrzędnym. |
|
Uwagi: |
W przypadku braku możliwości prowadzenia zajęć w formie stacjonarnej zajęcia będą odbywać się przy użyciu narzędzi komunikacji na odległość, najprawdopodobniej Google Meet oraz innych zalecanych przez UW. |
Właścicielem praw autorskich jest Uniwersytet Warszawski, Wydział Chemii.