Pobierz materiał i Publikuj za darmo
Prof. Robert Lew z Wydziału Anglistyki UAM w niedawnej publikacji wskazuje, że ChatGPT - system sztucznej inteligencji generujący treść - nieźle radzi sobie z tworzeniem w języku angielskim haseł do pewnego typu słowników. Chodzi o słowniki dla osób uczących się języka angielskiego, które współcześnie tworzy się na podstawie analizy korpusów językowych. Pionierskim słownikiem tego typu był słownik COBUILD, który między innymi stosuje nowatorski format definicji ilustrujący użycie danego wyrazu w kontekście.
"Polskim odpowiednikiem słownika COBUILD jest 'Inny słownik języka polskiego' Mirosława Bańki. Zawarte tam definicje są łatwe do zrozumienia, konwersacyjne. Np. 'Kiedy mówimy, że coś się wlecze bez końca, to trwa za długo'" - podaje przykład prof. Lew.
Naukowiec tłumaczy, że opracowany w latach 80. XX w. słownik COBUILD był pierwszym słownikiem budowanym na bazie korpusów językowych. A korpusy to zbiory realnych tekstów reprezentujących użycie języka.
"Dawniej leksykografia była sztuką intuicji lub bazowała na kopiowaniu pomysłów ze starszych słowników. A pod koniec XX wieku pod wpływem korpusów językowych wiodąca leksykografia zaczęła być postępowaniem empirycznym, ściśle osadzonym w danych” - wyjaśnia badacz. W korpusie językowym sprawdzano więc, w jakich kontekstach rzeczywiście używane są najczęściej słowa. Na tej podstawie powstawał opis leksykograficzny języka, w tym definicje i przykłady użycia.
Źródło informacji: Nauka w Polsce
Pobierz materiał i Publikuj za darmo
bezpośredni link do materiału
Data publikacji | 28.11.2023, 09:00 |
Źródło informacji | Nauka w Polsce |
Zastrzeżenie | Za materiał opublikowany w serwisie PAP MediaRoom odpowiedzialność ponosi – z zastrzeżeniem postanowień art. 42 ust. 2 ustawy prawo prasowe – jego nadawca, wskazany każdorazowo jako „źródło informacji”. Informacje podpisane źródłem „PAP MediaRoom” są opracowywane przez dziennikarzy PAP we współpracy z firmami lub instytucjami – w ramach umów na obsługę medialną. Wszystkie materiały opublikowane w serwisie PAP MediaRoom mogą być bezpłatnie wykorzystywane przez media. |