Uniwersytet Warszawski, Wydział Chemii - Centralny System Uwierzytelniania
Strona główna

Lingwistyka korpusowa

Informacje ogólne

Kod przedmiotu: 3223-LK-OG
Kod Erasmus / ISCED: 09.0 Kod klasyfikacyjny przedmiotu składa się z trzech do pięciu cyfr, przy czym trzy pierwsze oznaczają klasyfikację dziedziny wg. Listy kodów dziedzin obowiązującej w programie Socrates/Erasmus, czwarta (dotąd na ogół 0) – ewentualne uszczegółowienie informacji o dyscyplinie, piąta – stopień zaawansowania przedmiotu ustalony na podstawie roku studiów, dla którego przedmiot jest przeznaczony. / (0231) Języki obce Kod ISCED - Międzynarodowa Standardowa Klasyfikacja Kształcenia (International Standard Classification of Education) została opracowana przez UNESCO.
Nazwa przedmiotu: Lingwistyka korpusowa
Jednostka: Instytut Komunikacji Specjalistycznej i Interkulturowej
Grupy: Przedmioty ogólnouniwersyteckie humanistyczne
Przedmioty ogólnouniwersyteckie Instytutu Komunikacji Specjalistycznej i Interkulturowej
Przedmioty ogólnouniwersyteckie na Uniwersytecie Warszawskim
Punkty ECTS i inne: 2.00 LUB 3.00 (zmienne w czasie) Podstawowe informacje o zasadach przyporządkowania punktów ECTS:
  • roczny wymiar godzinowy nakładu pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się dla danego etapu studiów wynosi 1500-1800 h, co odpowiada 60 ECTS;
  • tygodniowy wymiar godzinowy nakładu pracy studenta wynosi 45 h;
  • 1 punkt ECTS odpowiada 25-30 godzinom pracy studenta potrzebnej do osiągnięcia zakładanych efektów uczenia się;
  • tygodniowy nakład pracy studenta konieczny do osiągnięcia zakładanych efektów uczenia się pozwala uzyskać 1,5 ECTS;
  • nakład pracy potrzebny do zaliczenia przedmiotu, któremu przypisano 3 ECTS, stanowi 10% semestralnego obciążenia studenta.

zobacz reguły punktacji
Język prowadzenia: polski
Rodzaj przedmiotu:

ogólnouniwersyteckie

Założenia (opisowo):

Student powinien posiadać podstawową wiedzę o języku polskim, wskazana wiedza z podstaw obsługi komputera oraz instalacji oprogramowania.

Tryb prowadzenia:

w sali

Skrócony opis:

Przedmiot przeznaczony jest dla studentów zainteresowanych podniesieniem swoich kompetencji językowych oraz rozpoznawaniem na podstawie prostych wskaźników stylu i intencji twórcy danego tekstu. Może także służyć poznaniu językowego obrazu danej osoby/ zjawiska/ problemu/ stereotypu w społeczeństwie komunikacyjnym lub przydać się w badaniu jakości tłumaczeń tekstów. Rozwija też kompetencje w zakresie prostych narzędzi informatycznych dostępnych w sieci. Umiejętności można zastosować też dla uatrakcyjnienia badań z innych przedmiotów lub wzmocnienia treści pracy dyplomowej.

Preferowany projekt końcowy, przygotowywany w trakcie zajęć może posłużyć do dalszego wykorzystania. Możliwe jest też zaliczenie przedmiotu w formie testu (częściowo) otwartego z materiału przedstawianego na zajęciach i w wybranej literaturze.

Na zajęciach omawiane są wybrane programy do analizy tekstów, tworzenia i oceny korpusów tekstowych, programy stylometryczne, i elektroniczne korpusy tekstowe.

Pełny opis:

Program kursu obejmuje wiadomości teoretyczne dotyczące budowy korpusów językowych, technik gromadzenia danych językowych oraz możliwości ich praktycznego wykorzystania:

1. Pojęcie korpusu językowego. Korpus językowy a zbiór tekstów. Badania teoretyczne a materiałowe: rola danych językowych w naukach społecznych, marketingu, mediach oraz językoznawstwie.

2. Typologia korpusów: korpusy jedno i wielojęzyczne, równoległe i porównywalne. Pojęcie reprezentatywności i adekwatności korpusów.

3. Podstawowe informacje na temat indeksacji korpusów językowych; umiejętności interpretacji podanych danych.

4. Podstawowe korpusy języka polskiego. Korpus NKJP wraz z narzędziami towarzyszącymi.

5. Dostępne narzędzia analizy korpusów tekstowych (AntConc, Jasnopis i in.).

6. Narzędzia analizy parametrycznej tekstu, zastosowania praktyczne pomiaru modalności tekstu.

7. Możliwe zastosowania korpusów w praktyce:

a) badanie języków specjalistycznych

b) korpus jako narzędzie wspomagające tłumacza

c) dydaktyka języków obcych

d) słowniki i modele słowników na różnych nośnikach danych

8. Korpusy tekstowe i teksty równoległe w pracy z programami wspomagającymi proces tłumaczenia (narzędzia CAT).

Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi pozwalającymi dowiedzieć się więcej o potrzebnym nam tekście, zanalizować statystycznie i stylometrycznie jego treść i wykorzystać miarodajne dane dla własnych celów (badawczych). Student po kursie powinien posługiwać się podstawowymi programami z zakresu lingwistyki cyfrowej oraz wyszukiwać potrzebne dane przy pomocy poznanych narzędzi. Kurs prowadzony z użyciem prezentacji i wizualizacji działania poszczególnych programów, w miarę dostępnych możliwości sprzętowych. Ponadto, kurs zakłada zdobycie umiejętności wyprowadzania indywidualnych wniosków z prowadzonych analiz lingwistycznych oraz ich wizualizacji. Nabyta wiedza ma posłużyć do stworzenia przez studenta (grupę studentów) określonego formalnie na zajęciach projektu korpusu tekstowego, stanowiącego podstawę zaliczenia (projekt lub nabyte umiejętności można zastosować dla uatrakcyjnienia badań z innych przedmiotów lub wzmocnienia treści pracy dyplomowej). Alternatywnie można zaliczyć przedmiot prezentując wiedzę przedmiotową na teście zaliczeniowym z treści zajęć i literatury.

Nakład pracy studenta (3 ECTS):

30 godzin obecność na zajęciach w sali (1)

30 godzin przygotowanie korpusu tekstowego lub opracowań alternatywnych (1)

15 godzin praca własna z oprogramowaniem (0,5)

15 godzin lektura i przygotowanie do zajęć, przygotowanie do egzaminu/omówienia projektu (0,5)

Literatura:

Literatura podstawowa:

- Gruszczyńska E., Leńko-Szymanska A. (red.), Polskojęzyczne korpusy równoległe / Polish-language Parallel Corpora, WLS UW, Warszawa, 2016.

- Karpiński Ł., Systemy leksykalno-komunikacyjne, Campidoglio, Warszawa, 2017.

- Karpiński Ł., 2017, Maszynowa charakterystyka tekstów specjalistycznych na potrzeby terminologicznych baz danych, [w:] "Komunikacja Specjalistyczna", t. 14/2017, s. 139-163.

- "Prace filologiczne", tom. LXIII, WP UW, Warszawa 2012 (tom zawierający zbiór prac dot. lingwistyki korpusowej)

Literatura uzupełniająca:

- Biber C., Corpus Linguistics. Investigating language structure and use, Cambridge Univesrity Press 1998.

- Celiński P., 2013a, Postmedia. Cyfrowy kod i bazy danych, Wydawnictwo UMCS, Lublin.

- Hebal-Jezierska M., Podstawowe zasady korzystania z korpusów przy badaniu języka, [w:] "Prace Etnograficzne", 2018, Tom 46, Numer 1, s. 30-49

- Kamińska-Szmaj I., 1989, Słownictwo tekstów popularnonaukowych w ujęciu statystycznym, [w:] „Rozprawy Komisji Językowej”, t. XVI, Wrocławskie Towarzystwo Naukowe, Wyd. PAN, Wrocław, s. 69-87.

- Karpiński Ł., Zarys leksykografii terminologicznej, KJS UW, Warszawa, 2008

- Karpiński Ł., 2009a, Wybrane założenia komputerowej analizy tekstów i gromadzenia danych, [w] „Języki Specjalistyczne 9 – Kulturowy i leksykograficzny obraz języków specjalistycznych”, (red. eidem), KJS UW, Warszawa

- Karpiński Ł., 2012a, Analiza parametryczna tekstu a translacja maszynowa – wybrane zagadnienia, [w] „The Linguistic Journal of Applied Linguistics”, (red.), Lingwistyczna Szkoła Wyższa w Warszawie, Warszawa.

- Karpiński Ł., Michałowski P., 2012, Wybrane metody analizy terminologii specjalistycznej (na przykładzie technolektu geografii), [w:] „Edukacja dla Przyszłości”, t. IX, 2012, Wydawnictwo Wyższej Szkoły Finansów i Zarządzania w Białymstoku, Białystok, s. 19-46.

- Lewandowska-Tomaszczyk B., Gramatyka angielska na autentycznych materiałach językowych, Łódź, WSSM 2004.

- Lewandowska-Tomaszczyk B., Podstawy językoznawstwa korpusowego, Wyd. Uniwersytetu Łódzkiego, Łódź 2005.

- Ludskanow A., 1973, Tłumaczy człowiek i maszyna cyfrowa, WNT, Warszawa

- McEnery T., Wilson A., Corpus Linguistics: an Introduction, Edinburgh : Edinburgh University Press, 2001

- Pawłowski A., 2001, Metody kwantytatywne w sekwencyjnej analizie tekstu, Uniwersytet Warszawski Katedra Lingwistyki Formalnej, Warszawa.

- Przepiórkowski A., Bańko M., Górski R., Lewandowska-Tomaszczyk B., Narodowy Korpus Języka Polskiego, PWN, Warszawa 2012

- Sambor J., 1969, Badania statystyczne nad słownictwem. Na materiale „Pana Tadeusza”, Wrocław-Warszawa.

- Świdziński M., 2006, Lingwistyka korpusowa w Polsce – źródła, stan, perspektywy, [w:] „LingVaria”, nr 1, Wydział Polonistyki UJ, Kraków.

- Tognini-Bonelli E., Corpus Linguistics at Work, John Benjamins, Amsterdam/Philadelphia 2001

Materiały autorskie prowadzącego, zbiory analiz, wizualizacje danych stylometrycznych.

Efekty uczenia się:

Student w zakresie poniższych kryteriów podwyższa kwalifikacje:

zna terminologię stosowaną w językoznawstwie i dziedzinach pokrewnych na poziomie rozszerzonym, orientuje się w najważniejszych kierunkach i metodach badań lingwistycznych; rozumie terminologię gramatyczną; posiada wiedzę na temat wybranych uwarunkowań pragmatycznych danych systemów językowych;

ma pogłębioną wiedzę na temat metodologii i prowadzenia badań językoznawczych lub literackich; zna styl naukowy i leksykę naukową; ma wiedzę na temat baz danych dla lingwistyki, posiada podstawową wiedzę na temat interpretacji danych pozyskanych z analiz;

zna popularne programy komputerowe wspomagające pracę tłumacza (CAT) oraz wybrane programy do analizy frekwencyjnej i stylometrycznej; zna możliwości wykorzystania tłumaczenia maszynowego;

Umiejętności:

wykorzystuje programy komputerowe przydatne w pracy tłumacza, potrafi właściwie formatować tekst w języku polskim, oraz w przynajmniej jednym w języku obcym; sprawnie posługuje się arkuszami kalkulacyjnymi i wykresami; potrafi korzystać z ogólnie dostępnych naukowych baz danych (w tym baz terminologicznych i korpusowych); sprawnie wyszukuje informacje, korzysta z wiedzy eksperckiej, ze słowników encyklopedycznych, językowych, terminologicznych ogólno-naukowych, ogólno-technicznych, interdyscyplinarnych i branżowych, korpusów językowych, baz danych, tekstów paralelnych;

potrafi wskazać luki w badaniach naukowych i kierunki ich kontynuowania; formułuje problemy badawcze, dobiera adekwatne metody, konstruuje narzędzia badawcze, opracowuje, prezentuje i interpretuje wyniki badań, wyciąga wnioski;

Kompetencje społeczne:

potrafi uzupełniać i doskonalić nabytą wiedzę o przynajmniej jednym języku specjalności oraz o własnym języku; jest świadomy konieczności ciągłego poszukiwania nowych źródeł słownikowych i tekstowych, a także śledzenia współcześnie powstających teorii naukowych; szybko reaguje na zmieniającą się rzeczywistość;

wyciąga wnioski z informacji zwrotnych, umie zarządzać czasem; utrzymuje kontakt ze środowiskiem tłumaczy, pracuje w środowisku wielokulturowym; zna środowisko pracy tłumacza;

potrafi pracować w grupie, współpracować z innymi, przyjmując odpowiednie role (funkcje); kierować małym zespołem (3-4 osoby w grupach ćwiczeniowych);

Metody i kryteria oceniania:

Metody oceny pracy studenta

- ocena aktywności i bieżące przygotowanie do zajęć;

- projekt (tematyczny korpus tekstowy lub alternatywa);

- końcowe zaliczenie pisemne (test lub analiza stylometryczna korpusu).

Kryteria oceniania (komponenty oceny końcowej):

- ocena ciągła z zajęć: 10%

- projekt (tematyczny korpus tekstowy): 40%

- zaliczenie końcowe: 50%

Egzamin (zaliczenie końcowe):

W przypadku testu mieszanego (wielokrotnego i/lub jednokrotnego wyboru) wiążąca jest liczba uzyskanych punktów.

W przypadku przygotowywania projektu analizy wybranych korpusów tekstowych wiążąca jest liczba uzyskanych punktów za poszczególne części opracowania.

Zasady punktacji dla oceny bieżącej i egzaminu/zaliczenia:

55%-69% = 3

70%-74% = 3+

75%-84% = 4

85%-89% = 4+

90%-100% = 5

Zasady współpracy prowadzącego ze studentami:

1. Nieobecności – dopuszczalne 3 nieusprawiedliwione nieobecności w semestrze (jest to zgodne z regulaminem).

2. Do końcowego zaliczenia można podejść po zaliczeniu projektu (zadania) oraz otrzymania pozytywnej oceny ciągłej zajęć.

3. Student ma prawo do dwukrotnej poprawy każdego sprawdzianu pisemnego. Nieprzystąpienie do sprawdzianu w pierwszym terminie bez usprawiedliwienia powoduje utratę tego terminu.

Zajęcia w cyklu "Semestr zimowy 2023/24" (zakończony)

Okres: 2023-10-01 - 2024-01-28
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Konwersatorium, 30 godzin, 16 miejsc więcej informacji
Koordynatorzy: Łukasz Karpiński
Prowadzący grup: Łukasz Karpiński
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Konwersatorium - Zaliczenie na ocenę
Skrócony opis:

Przedmiot przeznaczony jest dla studentów zainteresowanych podniesieniem swoich kompetencji językowych oraz rozpoznawaniem na podstawie prostych wskaźników stylu i intencji twórcy danego tekstu. Może także służyć poznaniu językowego obrazu danej osoby/ zjawiska/ problemu/stereotypu w społeczeństwie komunikacyjnym lub przydać się w zakresie badania tłumaczeń tekstów z/na języki obcych. Rozwija także kompetencje w zakresie prostych narzędzi informatycznych, dostępnych w sieci. Nabyte umiejętności można zastosować dla uatrakcyjnienia badań z innych przedmiotów lub wzmocnienia treści pracy dyplomowej. Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi tworzenie ukierunkowanych korpusów tekstowych badających zadany problem. Na zajęciach omawiane są wybrane programy do analizy tekstów, tworzenia i oceny korpusów tekstowych, programy stylometryczne, i elektroniczne korpusy tekstowe. Nabyta wiedza ma posłużyć do stworzenia przez studenta (lub grupę studentów) określonego projektu korpusowego.

Pełny opis:

Zgodnie z opisem nadrzędnym.

Literatura:

Zgodnie z opisem nadrzędnym.

Uwagi:

W przypadku braku możliwości prowadzenia zajęć w formie stacjonarnej zajęcia będą odbywać się przy użyciu narzędzi komunikacji na odległość, najprawdopodobniej Google Meet oraz innych zalecanych przez UW.

Zajęcia w cyklu "Semestr letni 2024/25" (jeszcze nie rozpoczęty)

Okres: 2025-02-17 - 2025-06-08
Wybrany podział planu:
Przejdź do planu
Typ zajęć:
Konwersatorium, 30 godzin, 20 miejsc więcej informacji
Koordynatorzy: Łukasz Karpiński
Prowadzący grup: Łukasz Karpiński
Lista studentów: (nie masz dostępu)
Zaliczenie: Przedmiot - Zaliczenie na ocenę
Konwersatorium - Zaliczenie na ocenę
Skrócony opis:

Przedmiot przeznaczony jest dla studentów zainteresowanych podniesieniem swoich kompetencji językowych oraz rozpoznawaniem na podstawie prostych wskaźników stylu i intencji twórcy danego tekstu. Może także służyć poznaniu językowego obrazu danej osoby/ zjawiska/ problemu/stereotypu w społeczeństwie komunikacyjnym lub przydać się w zakresie badania tłumaczeń tekstów z/na języki obcych. Rozwija także kompetencje w zakresie prostych narzędzi informatycznych, dostępnych w sieci. Nabyte umiejętności można zastosować dla uatrakcyjnienia badań z innych przedmiotów lub wzmocnienia treści pracy dyplomowej. Celem zajęć jest zapoznanie z podstawowymi narzędziami informatycznymi wspierającymi tworzenie ukierunkowanych korpusów tekstowych badających zadany problem. Na zajęciach omawiane są wybrane programy do analizy tekstów, tworzenia i oceny korpusów tekstowych, programy stylometryczne, i elektroniczne korpusy tekstowe. Nabyta wiedza ma posłużyć do stworzenia przez studenta (lub grupę studentów) określonego projektu korpusowego.

Pełny opis:

Zgodnie z opisem nadrzędnym.

Literatura:

Zgodnie z opisem nadrzędnym.

Uwagi:

W przypadku braku możliwości prowadzenia zajęć w formie stacjonarnej zajęcia będą odbywać się przy użyciu narzędzi komunikacji na odległość, najprawdopodobniej Google Meet oraz innych zalecanych przez UW.

Opisy przedmiotów w USOS i USOSweb są chronione prawem autorskim.
Właścicielem praw autorskich jest Uniwersytet Warszawski, Wydział Chemii.
ul. Pasteura 1, 02-093 tel: +48 22 55 26 230 http://www.chem.uw.edu.pl/ kontakt deklaracja dostępności mapa serwisu USOSweb 7.1.1.0-2 (2024-11-25)