liczba godzin: 30 godzin
okres trwania: 15 tygodni
termin kursu: 18.02.2014-3.06.2014 
ECTS: 3
Zaliczenie
Kurs kończy się kolokwium, do którego zostaną dopuszczone osoby, które uzyskały co najmniej 60% punktów z zadań.


charakterystyka zajęć:

Jedną z dziedzin życia zrewolucjonizowanych przez komputery jest korzystanie ze słowników i encyklopedii oraz ich tworzenie.
Coraz więcej tekstów jest czytanych i pisanych na komputerze, a w tych sytuacjach słowniki dostępne na komputerze lub za jego pomocą są bardziej wygodne od tradycyjnych. Choć jeden czy nawet kilka słowników tradycyjnych można mieć pod ręką przy komputerze, to jednak wyszukiwanie informacji w słownikach elektronicznych jest o wiele szybsze i łatwiejsze od wertowania wersji papierowej, zwłaszcza wielotomowej. Słowniki takie często mają dodatkowe funkcje niedostępne w słownikach klasycznych, np. moduł analizy morfologicznej pozwala odnaleźć w słowniku dowolną formę fleksyjną, a nie tylko formę hasłową, co jest szczególnie istotne dla języków o skomplikowanej morfologii (np. suahili) lub stosujących niełacińskie systemy pisma (np. chiński i japoński). To samo dotyczy również encyklopedii.
Komputery wpłynęły również na sposób tworzenia słowników. Zamiast kartotek z fiszkami wykorzystuje się duże zbiory tekstów elektronicznych, czyli korpusy będące własnością wydawnictw lub dostępne publicznie. Artykuły hasłowe słowników i encyklopedii, które z reguły mają skomplikowaną strukturę, coraz częściej zapisuje się w formalizmach takich jak Extensible Markup Language (XML). Upowszechnienie Internetu pozwala użytkownikom brać udział w tworzeniu tych publikacji lub przygotowywać je w nieformalnych zespołach.

Tematyka:
Program obejmuje m.in.:

  1. Podstawowe pojęcia leksykografii (na podstawie m.in. Zrozumieć leksykografię T. Piotrowskiego).
  2. Graficzne digitalizacje słowników tradycyjnych (np. Century Dictionary).
  3. Tekstowe digitalizacje słowników tradycyjnych (np. OED, TLF).
  4. Słowniki internetowe - protokół HTTP (np. Wiktionary, PWN).
  5. Słowniki internetowe - protokół DICT (np. Webster).
  6. Reprezentacja słowników w SGML i XML (na przykładzie rekomendacji konsorcjum TEI)
  7. Korpusy jako narzędzie leksykografa
  8. Zdecentralizowane tworzenie słowników i encyklopedii (np. Wikipedia i Wikisłownik)

Adresaci kursu:
Studenci i doktoranci wszystkich kierunków.

Niezbędna jest znajomość języka angielskiego umożliwiająca czytanie tekstów.


Adres głównego prowadzącego:

dr Joanna Bilińska: j.bilinska@uw.edu.pl