Niektórzy lingwiści twierdzą, że możemy rozważać lingwistykę korpusową jako metodologię, lecz inni mówią, że to jest nawet nowa dziedzina językoznawstwa. Ten spór spowodował gorącą debatę, ponieważ językoznawstwo korpusowe przeszło niezwykły renesans w ostatnich latach: od bycia marginalną metodą do użycia jej w wielu ważnych badawczych kwestiach/ sprawach w językoznawstwie.
McEnery i Wilson (2001:1) twierdzą, że językoznawstwo korpusowe jest metodologią, nie dziedziną językoznawstwa jak składnia, semantyka i tak dalej. Może być użyte w prawie wszystkich aspektach językoznawstwa.
Według Nesselhauf’a (2005) „językoznawstwo korpusowe jest metodą przeprowadzania lingwistycznych analiz.” Niedawno stało się jednym z najbardziej rozpowszechnionych metod językoznawczych badań na podstawie skomputeryzowanych korpusów. Można zbadać częstotliwość badanych zjawisk za pomocą wyspecjalizowanego oprogramowania.
Jednakże, Baker (2010) uważa, że językoznawstwo korpusowe w ciągu ostatnich dwudziestu lat stało się niezależną dziedziną lingwistycznych badań. Baker (2010) podkreśla, że jednym z powodów szybkiego rozwoju jest popularyzacja komputerów i dostęp do Internetu (Baker, 2010:1-5).
Co to jest korpus?
Termin ‘korpus’ pochodzi z języka łacińskiego i oznacza ‘ciało’. Według McEnery’ego i Wilson’a (2001:29), „zbiór więcej niż jednego tekstu może się nazywać korpusem”. Ponadto, każdy rodzaj tekstu może być definiowany jako korpus. Baker (2010) definiuje korpus jako „‘ciało językowe’, lub dokładniej, bardzo duży zbiór naturalnie występującego języka, zapisanego jako plik komputerowy ... reprezentatywna próbka szczegółowej różnorodności językowej” (Baker, 2010:6).
Gries (2009:7) opisuje korpus jako komputerowy zbiór (ustnych lub pisemnych) tekstów, które powstały w naturalnej komunikatywnej scenerii. Taka kolekcja tekstów jest sporządzona z intencją bycia reprezentatywną i zrównoważoną w związku z szczegółową lingwistyczną różnorodnością, rejestrem lub gatunkiem i analizą lingwistyczną.”
Użycie korpusu w nauce języka
Korpusy są używane w wielu dziedzinach badań nad językiem:
• Badania nad mową: wyniki pochodzące z korpusu odzwierciedlają ogromną próbkę naturalnej rzeczywistej mowy różniącej się rodzajem, wiekiem, klasą społeczną mówcy lub gatunkiem literackim (np. prasa, poezja, język urzędowy).
• Badania nad leksyką: dzięki korpusowi leksykografowie mogą przywołać przykłady słowa lub wyrażenia spośród setki tekstów w kilka sekund. Te dane mają wielkie znaczenie podczas tworzenia słowników (leksykografia), a mianowicie definicje mogą być uzupełnione lub nawet obalone.
• Gramatyka: korpus jest przydatnym narzędziem dla gramatycznych badań podczas sprawdzania hipotez zaczerpniętych z gramatycznych teorii.
• Semantyka: korpus może być obiektywnym kryterium podczas nadawania znaczeń lingwistycznym terminom. Semantyczne różnice są skojarzone w tekstach z kontekstami – syntaktycznym, morfologicznym i prozodycznym (McEnery, Wilson).
Rodzaje korpusów
Obecnie dzięki nowoczesnej technologii komputerowej tworzone są coraz większe korpusy. Korpusy zawierają szeroki wachlarz próbek różnych autorów i gatunków po to, by być reprezentatywnym dla poszczególnej różnorodności językowej. Jest wiele korpusów, które mogą być użyte do badań nad lingwistycznymi zapytaniami. Nesselhauf (2005) przedstawia następującą typologię korpusów:
• ogólne korpusy, np. Angielski Korpus Narodowy: różnorodność językowa jako całość (ustny i pisany język, różne rodzaje tekstów),
• historyczne korpusy, np. Helsinki Korpus, ARCHER: przedstawia zmiany form w języku w różnych okresach czasu,
• korpusy regionalne, np. WCNZE = Wellington Corpus of Written New Zealand English: pokazuje regionalne różnice językowe,
• korpus dla uczących się, np. ICLE = International Corpus of Learner English: przedstawia język uczących się (ICNALE skupia azjatyckich uczących się, zawiera eseje pisane przez studentów z 10 azjatyckich krajów),
• wielojęzyczne korpusy: pokazują różnice w kilku językach w tym samym tekście – kontrastywna analiza,
• ustne korpusy, np. LLC = London-Lund Corpus of Spoken English: prezentuje język ustny.
Nesselhauf (2005) wspomina poza tym korpusy dostępne nie tylko dla studentów języka angielskiego, ale dla każdego poprzez Internet:
• The Collins Wordbanks Online English Corpus: ustne i pisemne teksty w brytyjskim i amerykańskim angielskim
• The British National Corpus (BNC) (Nesselhauf, 2005:2-3).
Większość korpusów składa się z tekstów w pisemnej formie. Dane z korpusów pomagają nam określać schematy składniowe, częstotliwość występowania, regularność oraz lingwistyczne normy.