ArticlePDF Available

THE POTENTIAL OF GOOGLE SEARCH FOR STUDIES IN COGNITIVE CORPUS LINGUISTICS

Authors:

Abstract

The paper investigates the possibility to employ the Google search system as an analogue of the corpus of texts for potential use in further cognitive research of a language. The purpose of the article is to elucidate the significance of statistical data available due to the use of different operators and filters of the search system in the study of cognitive mechanisms of representation of linguistic reality in speech. Experimental observations have been made to compare the results of competing queries in Google and Russian National Corpus based on the word order variability of binomial phrases. The results obtained showed that the volume and variety of language data justifies the employment of Google for these purposes. This leads to the conclusion that these data can be considered valid as linguistic material for further interpretation in cognitive language research
УДК811.1
UDC811.1
ПетроваИннаМихайловна
Московскийгородскойпедагогическийуниверситет
г.Москва,РоссийскаяФедерация
InnaM.Petrova
MoscowCityUniversity
Moscow,RussianFederation
miinna@yandex.ru
ПОТЕНЦИАЛПОИСКОВОЙСИСТЕМЫGOOGLE
ПРИПРОВЕДЕНИИИССЛЕДОВАНИЙВРАМКАХ
КОГНИТИВНОЙКОРПУСНОЙЛИНГВИСТИКИ
THEPOTENTIALOFGOOGLESEARCHFORSTUDIES
INCOGNITIVECORPUSLINGUISTICS
Аннотация
СтатьяпосвященаиспользованиюпоисковойсистемыGoogleвкачествеаналогакорпу
сатекстовприпроведениикогнитивныхисследованийязыка.Цельстатьи–определить
значимостьстатистическихданных,доступныхврезультатеиспользованияразныхопе
раторовифильтровпоисковойсистемы,приизучениикогнитивныхмеханизмоврепре
зентации языковой действительности в речи. В статье проводится сравнение
результатовконкурирующихзапросоввGoogleи Национальномкорпусерусскогоязы
ка(НКРЯ), сформированныхнаоснове вариативностикомбинаторики биноминальных
фраз.Проведённыйэкспериментпоказал,чтообъёмиразнообразиеязыковогоматериа
лауказываютнабóльшуюэффективностьиспользованияGoogleдляисследованияком
бинаторики и вариативности фразы, что позволяет сделать вывод относительно
обоснованности применения этих данных в качестве лингвистического материала для
дальнейшейинтерпретациивкогнитивныхисследованияхязыка.
Abstract
Thepaperinvestigatesthepossibilityto employtheGooglesearch systemasananalogue of
thecorpusof textsforpotentialusein furthercognitiveresearchof alanguage.Thepurpose
of the article is to elucidate the significance of statistical data available due to the use of
differentoperatorsand filters of thesearch system in the study of cognitivemechanisms of
representation of linguistic reality in speech. Experimental observations have been made to
comparethe results of competingqueries in Google andRussian National Corpus based on
thewordordervariabilityof binomial phrases.Theresultsobtainedshowedthatthe volume
and variety of language data justifies the employment of Google for these purposes. This
leadstotheconclusionthatthesedatacanbeconsideredvalidaslinguisticmaterialforfurther
interpretationincognitivelanguageresearch.
Ключевые слова: корпусная когнитивная лингвистика, алгоритм поисковой системы,
комбинаторикафразы,биноминальныеконструкции,поисковыйзапрос.
Теоретическаяиприкладнаялингвистика,2019,5(3),127‒142 127
Keywords: corpus cognitive linguistics, search engine algorithm, phrase combinatorics,
binominalphrases,searchquery.
doi:10.22250/24107190_2019_5_3_127_142
1. Введение
Всовременнойлингвистикевсёбольшеибольшеисследованийпро
водится с использованием корпусов текстов урыкин, 2015 ; Манерко,
2018;Сулейманова,Демченко,2018идр.].Этообусловленотем,чтоуско
реннаякомпьютернаяобработкамассивовтекстов(корпусов),согласноза
даннымпараметрам,предоставляетобширныйлингвистическийматериал,
позволяющийполучатьновыезнанияоязыке.Перспективыиспользования
этих технологий активно обсуждаются в научном сообществе олубкова,
2017 ; Рахилина, 2017 ; Чумарина, 2017 и др.]. Отмечая положительные и
отрицательные стороны использования корпусных методик при изучении
языковыхявлений,практическивсеисследователиконстатируютнеизбеж
ность обращения к данному инструментарию. Постоянно растущий ин
терес к возможностям поисковых систем типа Google и недостаточная
изученность применения инструментария, предоставляемого современны
митехнологиями,влингвистическихи,вчастности,вкогнитивныхиссле
дованияхопределяютактуальностьданнойработы.
Приизучениикогнитивныхпроцессовчрезвычайноважнымиоказы
ваютсястатистические параметры,учёткоторыхпозволяет интерпретиро
ватьэтипроцессынадругомуровне.К. Фишероднимизпервыхпоставил
перед лингвистамикогнитологами вопрос о том, как можно при помощи
количественных методов исследовать значение в когнитивной семантике
[Fischer,2010,с. 44].Врезультатевозникцелыйрядколичественныхмето
дов,которые активноиспользуютсяв когнитивнойсемантике.В их число
входят,например,методматематической модели, кластерный анализ, кор
реляционный анализ, логистическая регрессия и другие (подробнее об
этомсм.[Fischer,2010]).Объединениестатистическойобработкиданныхс
результатами применения других экспериментальных методик становится
важным элементом исследования в когнитивной науке. Анализ эмпириче
скихданныхиихинтерпретацияпозволяютчётчеформулироватьгипотезу
и выявлять противоречия между теоретическим и практическим исследо
ваниемявления,особенно втомслучае, когда «первичнаягипотеза, полу
ченная в ходе интроспективного анализа, противоречит результатам
статистических данных корпуса; интерпретируя результаты, мы можем
прийти либо к формулированию более точной гипотезы и постановке но
выхвопросов, которыевпоследующем могут статьосновой для экспери
ментальных проверок данной гипотезы, либо к новым противоречиям с
результатами корпусных данных и т. д.» [Tummers, 2005, с. 233]. Другими
словами, анализ статистики корпусных данных выступает таким инстру
ментомисследования,восновекоторогозаложензначительныйпотенциал
Петрова Н. М./ТиПЛ,2019,5(3),127‒142
128
дляинтерпретации определённоголингвистическогоявленияи коррекции
наших воззрений на данное явление с учётом объективных факторов. Та
ким образом, новизна настоящего исследования заключается в том, что в
нёмпредпринятапопыткавыявлениявозможностейсовременногоинстру
ментариядляизученияязыковойдействительностиспозицийкогнитивной
науки.
Цель настоящей работы – установить, насколько репрезентативен и
релевантенязыковой материал,полученныйнаоснове поисковойсистемы
Google,для когнитивныхисследованийязыка.Для достиженияуказанной
целипланировалосьрешитьследующиезадачи:
1) выявитьролькорпусныхданныхприпроведениикогнитивныхис
следованийязыка;
2) выяснить и описать особенности обработки языкового материала
поисковойсистемой;
3) сравнить результаты поисковых запросов, полученных на основе
Национальногокорпусарусскогоязыка(далее–НКРЯ)иGoogle,иустано
вить обоснованность применения Google данных как аналога языкового
корпуса.
В данной статье мы рассматриваем потенциал поисковой системы
Googleкакбазыкорпусныхданныхприпроведениикогнитивныхисследо
ванийязыка.Языковойкорпустекстоввыступаеткак«большой,представ
ленный в электронном виде, унифицированный, структурированный,
размеченный, филологически компетентный массив языковых данных,
предназначенный длярешения конкретныхлингвистических задач»[Заха
ров,Богданов,2011,с. 7].Подробноеописаниелингвистическогокорпусаи
еговидовможнонайти,например,вработеН. В. Козловой[Козлова,2013].
Однако наряду с существующими языковыми корпусами активно исполь
зуетсяи сетьИнтернет, посколькуонаобладаетмногими характеристика
ми данного инструментария. Дискуссия о «вебе как корпусе» становится
всёболеепопулярнойуисследователейи,несмотряна то,чтовеботлича
ется спонтанностью и специфической репрезентативностью, а также от
сутствием лингвистического замысла, А. Ю. Мордовин полагает, что
лёгкаядоступностьивысокаяобъективностьданныхввидуотсутствияав
торскогоколлективавзначительнойстепеникомпенсируютэтинедостатки
и функционально приравнивают веб к корпусу, что требует переосмысле
ния онтологического определения последнего. При этом он отмечает, что
веб «успешно применяется для решения исследовательских задач корпус
нымиметодами,и воспроизводит многие существенные признаки корпуса
текстов: аутентичность текстов, их машиночитаемый формат и средства
навигации по материалу, репрезентативность материала (в соответствии с
идеологией мониторного типа корпуса), а также более чем достаточный
размер»[Мордовин,2015,с. 171].Этопозволяетговоритьотом,чтонеоб
ходимо корректировать современные воззрения о классическом корпусе
текстов.Настоящаястатьяпредставляетсобойпопыткурассмотренияэто
говопросавопределённомключе,аименно,вконтекстеиспользованията
кихданныхвкогнитивныхисследованияхязыка.
129
Петрова Н. М./ТиПЛ,2019,5(3),127‒142
2. Информационная поисковая система как база корпусных
данныхвлингвистическихисследованиях
Многие исследователи уже используют веб как источник аутентич
ных, естественных, контекстуализированных языковых моделей онкор
дансов, устойчивых словосочетаний, лексических комбинаций, фраз,
идиомидр.)[Сулейманова,Демченко,2018 ;Квашина,Ажель,2017 ;Мор
довин, 2015 ; Gatto, 2014 ; Geluso, 2013 и др.]. Благодаря неисчерпаемому
объёмуВсемирнаясетьявляетсяуникальнымресурсомдляанализачасто
тыиспользованиятехилииныхязыковых моделей,а значит,естественно
го, «живого» языка. Наиболее востребованной поисковой системой
является система Google благодаря своей простоте и быстроте, функцио
нальностипоискаинформации,атакжерепрезентативности.Результатра
боты Google можно сравнить с интернеткаталогом, отобранным с
помощьюрейтинговойсистемынаосновеалгоритмов.Болееконкретноал
горитм поиска можно описать как «нахождение элемента с заданными
свойствамисредисписка элементов».В современномобучениииностран
ному языку эта система используется в качестве инструмента, позволяю
щего проанализировать частоту употребления и значение той или иной
языковоймодели[Panah,2013 ;Квашина,Ажель,2017].
Информационнаяпоисковаясистема(далее–ИПС)строитсянаосо
бом алгоритме обработки языковой информации. При вводе документа в
базуданныхИПСегоиндексируют(поэтомусамубазупоисковойсистемы
частоназываютиндексом). Процесс индексированиясвязансопределени
емивыборкойключевыхсловобрабатываемыхдокументовивыражением
ихформальноввидепоисковогообраза.Так,базаданныхИПСсостоитиз
множества индексных поисковых образов. Непосредственно при поиске
производитсясопоставлениесделанногозапроса,тоестьтого,чтоуказано
взапросе,споисковымобразом,тоестьстем,чтохранитсявиндексе.
Ключевыми характеристиками информационного поиска, релевант
нымидляобоснованностинадежностиGoogleданных,служаттакиепока
затели, как: полнота выдачи информации и точность её выдачи; но при
этомимеютместопотериинформациииинформационныйшум.
Отношениеколичествавыданныхрелевантныхдокументовкобщему
числурелевантных документов, содержащихсяв базе информационнопо
исковой системы, определяетполнотупоиска. Точностьпоискаопределя
ется количеством выданных системой релевантных документов к общему
числудокументовв выдаче.Понятие «релевантность» выступаеткакфун
даментальное понятие теории информационного поиска. Документ, цен
тральный предмет или тема которого в целом соответствует смысловому
содержанию информационного запроса, называется релевантным, а свой
ство смысловой близости между документом и информационным запро
сом–релевантностью.
Важное место в системе представления информации в ИПС играют
поисковые тезаурусы (одноязычные или многоязычные). Они представ
ляютсобойспециальные словаридляинформационногопоискапо масси
вам естественноязыковых документов, организованные по принципу
130 Петрова Н. М./ТиПЛ,2019,5(3),127‒142
сопоставлениясловсихпонятиями.Ихструктураиразработкачастостан
дартизируются(см.,напр.,ГОСТ7.252001).Такойдескрипторныйсловарь
используется как средство лексического контроля (напр., снятия омони
мии, синонимии единиц) при индексировании документов и запросов.
Например,прииндексированиивсесинонимызапросаипоисковогообраза
представляютсяоднойитойжелексическойединицей–дескриптором(ср.
лингвистика–языкознаниеязыковедение,наукаоязыке).
Какправило,тезаурусыотносятсякклассусемантическихсловарей.
Пример организации семантической информации в поисковом тезаурусе
можно продемонстрировать на примере «Русского семантического слова
ря»подредакциейН. Ю. Шведовой[Шведова, 1998].Так,вразделе«Фор
мы и сущностные характеристики реалий и явлений действительности»
представлена следующая семантическая структура организации лексиче
ской информации: в вершине древа лежат четыре исходных множества:
1) «Время; его ход, периоды и моменты его течения»; 2) «Пространство:
егоосновныехарактеристики;мерапространства,еговеличины»;3) «Дви
жение, изменение местоположения в пространстве» и 4) «Количество.
Счёт. Масса (вес), её мера. Степень, предел, граница». Каждое из этих
четырёхмножестввключает своисобственныеподмножества,членящиеся
каждоепопринципусуженияиконкретизацииобщегозначенияинисходя
щие,разветвляясьдоконечныхлексикосемантическихрядов,далееразби
ваемых только на отдельные лексические единицы или их мельчайшие
объединения.Например,лексическоемножество«Время:егоход,периоды
и моменты его течения» существует в двух подмножествах: «Время, его
основные характеристики» и «Отрезки, периоды времени, соотносимые с
какимнибудь состоянием, событием, деятельностью, действием». В пер
вомизнихисходныйсмысл‘время’далееконкретизируетсяпопризнакам,
организующим предконечные и конечные группировки словозначений;
а) ход, течение времени (напр., давность, длительность, продолжитель
ность), б) способы, системы исчисления времени (напр., летосчисление,
календарь, стиль), в) виды сегментации и единицы исчисления времени
(напр.,интервал,момент,период;век,год,месяц,день,час).Второеизна
званныхвышеподмножеств–«Отрезки,периодывремени,соотносимыес
какимнибудь состоянием, событием, деятельностью, действием» – вклю
чает такие единицы, которые, наряду со смыслом ‘время’ заключают в
своёмзначениилибообобщённоеуказаниенасоциальныеилифизические
явления,соотносимыес определённым временнымпериодом(напр., буду
щее,настоящее,прошлое/человечества/,времена,годы/юности/,полоса,
сезон/дождей/), либоконкретнуюхарактеристику такогоявления,состоя
ния(например,сеанс,антракт,отпуск,стаж;рассвет,закат;зима,вес
на, лето; молодость, старость; неолит, палеолит). Соотношение этих
элементовзначениявсловеопределяетсобоюпоследующеечленениедан
ногоподмножества.
Таким образом, у поисковых систем Интернета имеются свои алго
ритмы поиска и выдачи информации, которые разработаны на основе
компьютернойсемантики.Дляуправленияииспользованиягибкогопоиска
131
Петрова Н. М./ТиПЛ,2019,5(3),127‒142
в языке поисковых запросов используются, так называемые, операторы –
этосимволыи команды,позволяющиенастраиватьусловияпоисказапро
са. Сам язык запросов максимально упрощён, чтобы любой пользователь
могснимсправитьсяивыбратьнеобходимыйдляегослучаяоператор.По
дробнееязыкзапросовизначенияоператоровможноизучить,задавпоиск
вбраузерепоисковойсистемы.Важнойособенностьюоператоровявляется
возможность их комбинирования. За счёт комбинаций операторов можно
выстроить сложные запросы. Например, оператор «» фиксирует порядок
слов и слова идут именно в этом порядке: «пламень и лёд». В результате
запросвыдает8,660результатов,вкоторыхименнотакойпорядокследова
ния компонентов. Комбинирование операторов позволяет максимально
гибконастроитьпоиск.
Вхождение ключевогослова – этоорганично вписанныйв текст по
исковыйзапрос. Вхожденияключевыхслов в текстбываютпрямые ираз
бавленные.Кпервомутипуотносятся фразы,вписанные втексткакесть,
безизменений,аковторому–всеостальные.Прямыеиточныевхождения
ключевыхсловвстречаются не так часто, потомучто оставить все слово
формыбезизмененийпочтиникогданеполучается.Чащевсегоонивысту
паюттекстоманкорадляссылок,используютсявконтекстнойрекламеили
вметатегах.Разбавочныевхожденияключевыхслов–этовхождения,вко
торых фразы изменяются разнообразным способом, например, введение
дополнительных слов, изменение словоформы, порядка слов. Ключевой
запрос:«семантическийсловарь»выдаётследующиеразбавочныевхожде
ния:«Русскийсемантическийсловарь»,«семантическиесловари»,«семан
тическийсловарьрусскогоязыка»,«семантические и понятийные словари
русского языка» и прочее. Выделяют семь видов вхождения ключей: пря
мое, разбавленное, морфологическое, прямое вхождение с разбавлением
знакамипрепинания,ключисошибками,вхождениена англоязычнойрас
кладке,обратныевхождения1.Пологикероботовпоисковиковформальное
прямое вхождение на 100% соответствуют пользовательскому запросу, а
значитивсястраницарелевантнее.Стоитотметить,чтодляпоисковыхро
ботовразницамеждупрямымиразбавочнымвхождениемключевогослова
неочевидна.Словавключевыхфразахмогутбытьзамененысинонимами,
роботыпоисковикитакжеучитываютэтивхождения.
Такимобразом,частотавхожденийвпоисковойсистемеотражаетре
левантность сайта запросу пользователя. Чем точнее сформулирован
запрос, тем точнее получается результат поиска. Другими словами, пред
ставление информации по результатам запроса будет отражать некий ас
пект общей системы знаний через призму компьютерной семантики.
Компьютерная семантика является элементом интеллектной системы и
косвенным образом коррелирует с интеллектуальной системой индивида.
Соответственно, результаты исследования семантических явлений через
призмуинтеллектнойсистемыдаютвозможностьопосредованноисследо
ватьсемантикуинтеллектуальнойсистемычеловека.
132
1Подробнееобэтомсм.http://kopiraitery.ru/seokopirajting/7vidovvxozhdeniyaklyuchej.htm
Петрова Н. М./ТиПЛ,2019,5(3),127‒142
2.1. Сравнение результатов запросов в НКРЯ и Google при
изменениикомбинаторикифразы
Для обоснованности использования поисковой системы в когнитив
ныхисследованияхмы обращаемсякмеханизмамрепрезентациидействи
тельности в языке посредством биноминальных конструкций, хотя для
этихцелеймогутбытьиспользованыидругиеязыковыеструктуры,напри
мер, атрибутивные конструкции (см., напр., работу О. А. Сулеймановой и
И. М. Петровой[Сулейманова,Петрова,2018].
Биноминальные конструкции представляют собой парные образова
ния существительных, объединённых либо антонимическими отношения
ми, например, добро и зло, либо синонимическими тепло и свет и тому
подобные.Исследованиекомбинаторикитакойфразыилипорядкаоргани
зации подобной синтаксической структуры можно рассматривать как
способ указания на распределение значимой для говорящего информации
во фразе, то есть актуализации того элемента высказывания, который вы
ступаетведущимвданнойпаре.Соответственно,изменениеэтогопорядка
отражает изменение в ментальной модели репрезентации этих компонен
тов информации, что сопряжено с индивидуальной интерпретацией дан
ныхэлементовфразы. Так,еслимыговоримсветитьма,доброи зло,то
очевидно,чтовтакойрепрезентациипонятийпервыйкомпонентиграетве
дущуюрольвданнойдуальной паре. Изменениекомбинаторикифразына
тьма и свет демонстрирует смещение акцента и актуализацию понятия
тьмавпрагматическомаспектефразы[Петрова2018,2019].
Рассмотрим потенциал Google для когнитивного исследования на
примере предоставления эмпирических данных при изучения данного во
проса более подробно. Для этой цели сравним результаты поисковых
запросов в НКРЯ и Google на предмет потенциальных возможностей для
изучения комбинаторики биноминальных фраз. Возьмём некоторые базо
вые понятия, выраженные биноминальной фразой, и произведём измене
ние комбинаторики этой фразы, например, мужчина и женщина (1) и
женщинаимужчина(2);светитьма(3)итьмаисвет(4).Врамкахдан
ногоэкспериментаформированиепоисковогозапросавGoogleстроилосьс
помощьюдвухоператоров:(1)фиксирующегопорядокслов[] и(2) отме
чающего порядок слов «». Для проведения этого эксперимента мы не ис
пользовали фильтры расширенного поиска намеренно, поскольку на
данномэтапеоснованнаязадача,стоящаяпереднами,состоялавустанов
лении репрезентативности и релевантности отобранного материала в
контекстекорпусногоподхода.
Каквидноиз представленной таблицы(табл. 1), количествовхожде
ний, определённых оператором «», устанавливающим точный порядок
слов, ниже, чем оператором, фиксирующим порядок слов. Это говорит в
пользу того, что запрос, оформленный оператором «» представляет реле
вантную по структуре фразы информацию. Поскольку вхождения фразы
могутбытьпрямымииразбавочными,приведёмпримерытакогопредстав
ленияинформации.
133
Петрова Н. М./ТиПЛ,2019,5(3),127‒142
Т а б л и ц а 1.РезультатыпоисковогозапросавGoogle,
оформленногооператорами[]и«»
Примечаниектаблице1 :Датаобращения18.11.2018.
1. Примерыпрямоговхожденияфразы:
– Мужчина и женщина: в чем отличия (http://russian7.ru/post/7
razlichijjmezhdumuzhchinamiizhenshhinami/);
– Женщина и мужчина–отношения сквозь века (https://foma.ru/
zhenshhinaimuzhchinaotnosheniyaskvozveka.html);
– Thecreationandseparationoflightanddarkcomesupinthemythsof
creationorcosmogony—fromkosmos,meaning“order,”andgenesis,meaning
“birth.” (https://www.psychologytoday.com/us/blog/myththemind/201805/
mythslightanddark)
Данные примеры содержат заданные формы биномов. В основном
онибылиполученыврезультатеиспользованияоператора«».
2. Примерыразбавочноговхожденияфразы:
– A ManAndAWoman by U2 song meaning, lyric interpretation, video
and chart position. (https://www.songfacts.com/facts/u2/amanandawoman). –
Вданнойфразевведёнартикль«а».
– Jun 5, 2018 – Showrunner Joe Pokaski and director Gina Prince
Bythewood weigh in onthe darkness and lightparallels of Freeform’s new
show (https://www.tvguide.com/news/cloakdaggerpreviewbehinddarkness
lightmetaphors/).Вэтомпримереимеетместовведениеновыхэлементовв
результатезапроса, вчастностиартикльthe и словоparallels, которые до
полняютструктуру.
134 Петрова Н. М./ТиПЛ,2019,5(3),127‒142
Приведённые примеры по большей части представляют собой тек
сты,выполняющиеноминативнуюфункцию.Очевидно,чтовыданныепо
исковым роботом данные гораздо разнообразнее. Мы представили
указанныепримерыисходяизихотносительнойкраткостиивозможности
продемонстрировать сохранение порядка следования компонентов бино
мов.Врезультатеанализаэкспериментальногоматериаламыпришликвы
воду, что оператор «» представляет более точную выборку материала,
посколькупроцентразбавочныхвхожденийфразвэтомслучаениже.
Проанализируем полученные данные на предмет процентного соот
ношенияколичествафраз(1)мужчинаиженщинаи(3)тьмаисвет,кото
рые показывают максимальное число вхождений в поисковую систему и
представляютсобойтрадиционныйпорядокследованияданныхбиномов,с
фразами(2)женщинаимужчинаи(4)тьмаисвет.Дляанализаиспользу
емданные,полученные с помощьюоператора«»,которыйпродемонстри
ровалболеерелевантнуювыборкуматериала(см.табл. 2).
Т а б л и ц а 2.ЧисловхожденийфразвGoogle,
отобранныхспомощьюоператора«»
Примечаниектаблице2 :Датаобращения18.11.2018.
Расчёт процентного соотношения производился нами на основании
пропорции,вкоторойколичествовхожденийфраз(1)и(3)приравнивалось
к100%.Цельпроведенияданныхрасчётов–установитьсколькопроцентов
составляют инвертированные фразы от объёма традиционных фраз. Дан
ныйпроцент нагляднодемонстрируетчастотностьупотребленияинверти
рованной фразы пользователями интернета в конкретный временной
период.Витогебылиполученырезультаты,представленныевтаблице3.
Т а б л и ц а 3.ПроцентноесоотношениечиславхожденийфразвGoogle
135
Петрова Н. М./ТиПЛ,2019,5(3),127‒142
Каквидно изполученных данных, для англоязычных пользователей
процентинвертированнойфразы(2)женщинаимужчина/womanandman
напорядоквыше,чемдлярусскоязычныхпользователей.Этоможетсвиде
тельствоватьотом,чтозначениекомпонентабиномаженщинаврепрезен
тации действительности в англоязычной среде Интернета выше по
сравнениюсрусскимязыком.
Соотношениефраз(3)светитьма/lightanddarknessи(4) тьма и
свет / darkness and light показывает достаточно высокую частотность ин
вертированныхфразвобоихязыках,нованглийскомязыкемынаблюдаем
очень высокий показатель – 84%. Это означает, что компоненты, состав
ляющие этот бином, не представляют существенной разницы для англо
язычной среды Интернета, в то время, как для русскоязычной среды эта
разницасущественна.
Такимобразом,проведённыйэкспериментдемонстрируетвозможно
стипоисковойсистемыGoogleпри исследовании вопросовотраженияре
альной действительности в языке посредством статистических данных.
Разумеется,подобныйподходнезаменяетдругихметодовлингвистическо
го исследования, но, безусловно, обогащает наше представление о языко
войреальности.
Теперь рассмотрим, как представлен результат исследования комби
наторикифразыспомощьюНКРЯ2.ПоискпоНКРЯстроитсяпопринципу
поискаточныхформ.
Т а б л и ц а 4.Результатыпоисковогозапроса(НКРЯ)
Примечаниектаблице4 :Датаобращения28.11.2018.
Согласно этим результатам, процентное соотношение фраз (1) муж
чинаиженщинаи(2)женщинаимужчинасоставляет0,4%,афраз(3)свет
итьмаи(4)тьмаисветсоответственно35,1%.Можноотметить,чтотруд
нообнаружитькорреляциювсоотношенияхфраз(1)и(2)междуданными
НКРЯ и Google, поскольку мы имеем 0,4% в НКРЯ и практически 10% в
Google. Корреляция соотношения фраз (3) и (4) выглядит следующим об
разом:35,1%вНКРЯи31,68%вGoogle, чтодостаточноблизко.Изэтого
136
2Длясравнения,в«Библиотекелексикографа»(которая,ксожалению,носитпринципиальнооффлайно
выйхарактер)А.А.Бурыкина[Бурыкин,2015]этосоотношениевыглядитследующимобразом:(1)«мужчина
иженщина»–19530документов;(2)«женщинаимужчина»–4177документов;(3)«светитьма»–1298до
кументов;(4)«тьмаисвет»–428документов.Этицифрытакжедемонстрируютзначительноболеевысокую
частотностьпервойбиноминальнойфразыпосравнениюсовторойитретьейпосравнениюсчетвёртой.
Петрова Н. М./ТиПЛ,2019,5(3),127‒142
следует,что,хотяобъёманализируемогоматериалавНКРЯнесопоставимо
меньше, чем в Google, определённая корреляция между данными про сле
живается,чтосвидетельствуетобихрелевантности.
Приведём несколько примеров из НКРЯ по результатам поискового
запроса,чтобыполучитьпредставлениео том,какогородаязыковоймате
риалподвергалсяобработке.
Примеркфразе(1)мужчинаиженщина:
В этот самый момент к нашему столу подошли двое, мужчина и
женщина, и уселись на свободные места [Булат Окуджава. Искусство
кройкиижитья.М.,1985].
Примеркфразе(2)женщинаимужчина:
Вдруг трое – мужчина, женщина, старик, толькочтоспокойнос
ним разговаривавшие, – кто чтото объясняет, кто советы дает, как
пройти,–увиделихлебикактодернулись,словнобыбросилисьмгновенно
итутжесдержались[ТатьянаТолстая.Сомнамбулавтумане.М.,1989].
Примеркфразе(3)светитьма:
Светитьмаведином,вОгне–этоиестьМакиавелли[ЮрийАза
ров.Подозреваемый.М.,2002].
Примеркфразе(4)тьмаисвет:
Поэтомумнекажется,вкаждомизнасестьтьмаисвет,просто
не всегда у нас в жизни есть возможность воспитать в себе хорошее
[ЮлияИдлис.Красота–этомы,люди//«Русскийрепортер».№ 22(200),9
июня2011].
Анализ приведённых примеров показывает, что языковой материал
НКРЯ нуждается втщательноманализе,поскольку,хотязапрос ивыдал 1
документсфразой(2)женщинаимужчина,фактически,впредставленном
примере порядок следования компонентов бинома был другим (см. выше
примеркфразе2).Темнеменее,ивGoogle,ивНКРЯимеетместостати
стическое отражение изменённой комбинаторики фразы, в частности, ко
личество вхождений фраз (2) женщина и мужчина и (4) тьма и свет
значительно ниже по показателям обоих баз данных. Количество приме
ров,представленныхGoogle,гораздобольше,чемвНКРЯ.
В результате проведённого исследования можно отметить ряд осо
бенностей рассматриваемых корпусных систем обработки языковых дан
ных,которыемыпредставляемвтаблице5.
Такимобразом,поставленная перед намизадачаотносительноуста
новленияправомерностииспользованияGoogleданныхвкачествеаналога
корпусной базы данных представляется решённой. Очевидно, что в про
ведённомэкспериментерелевантностьпримеровотносительнокомбинато
рики фразы требует внимательного рассмотрения, поскольку в поисковой
системеможет иметь место разбавочноевхождение,ав НКРЯ, например,
изменениесинтаксическойорганизациифразы. Однакоприменениеопции
расширенногопоискавGoogleоткрываетпереднамивозможностьполуче
ния данных, ограниченных рядом параметров, например, точной структу
ройфразы,типомтекста,странойупотребленияитакдалее.
137
Петрова Н. М./ТиПЛ,2019,5(3),127‒142
Т а б л и ц а 5.СравнениеНКРЯиGoogleвконтексте
лингвистическихисследований
Полученныерезультатымогутслужитьматериаломдлядальнейшего
болееподробногоизучениявопросовкомбинаторикиивариативностифра
зывкогнитивномключе.
Необходимо отметить, что данная поисковая система предоставляет
возможность решать задачи не только относительно биноминальных
конструкций,но и другихсинтаксическихструктур,например,атрибутив
ных групп, типа большой красивый дом/красивый большой дом. Анализ
статистических данных вариативностиподобныхфраз в контекстетеории
классовпозволяетделатьважныевыводыобизменениикогнитивногофо
куса высказывания. Кроме того, инструментарий Google представляется
полезным и при проведении лингвистических экспериментов, например,
на вариативность предикаций, выраженных фразами с фазовыми глаголь
ными биномами такими, как решил начать учиться/учиться решил на
чать. Анализ вариативности таких структур даёт возможность
внимательно рассмотреть механизм распределения информации в когни
тивномполечерез призму категорий Интенция– Фаза–Действие. Таким
образом, спектр задач с использованием рассматриваемого эксперимен
тальногоинструментарияможетбытьдостаточношироким.
Вместестемнеобходимо подчеркнуть,чтоязыкзапросовGoogleне
поднимается на более высокий уровень абстракции. Это не позволяет ра
ботатьсчастямиречи,синтаксическими единицами,модальностями и то
му подобными вещами, а только с конкретными лексемами (и
ограниченно–сформамиэтихлексем:числами,падежами,родамиит.п.;
а также ограниченно – с опечатками и синонимами (благодаря специаль
138 Петрова Н. М./ТиПЛ,2019,5(3),127‒142
нойсистемесинонимов,работанадкоторойвеласьразработчикамиGoogle
5 лет)). Это означает, что исследователи, использующие Google и другие
поисковые системы в сети Интернет, не должны питать иллюзий относи
тельно их аналитических возможностей на уровне языковых абстракций.
Эффективноепланированиепоисковыхзапросов,систематизацияполучен
ныхданныхииханализпопрежнемуостаютсянаплечахлингвистов.Од
нако грамотное использование сети с ясным пониманием её
ограниченности, несомненно, поможет нарастить объёмы данных, что, в
сочетаниис традиционнымиметодамилингвистическогоанализа, сделает
исследованиеболееобъективнымидостоверным.
3. Заключение
Проведённое исследование показывает, что статистические данные,
полученныенаосновекорпусовтекстов и поисковыхсистем, могутвысту
патьвкачествематериалаисследованияприизучениекогнитивныхаспектов
языковойдействительности. В ходе когнитивных исследованийязыка с по
мощьюкорпусныхбазданныхважнымпредставляетсяправильностьформу
лировки исследовательской задачи, позволяющая интерпретировать
полученные данные в контексте заданного подхода. Объёмный статистиче
скийматериалможетслужитьосновойдляверификациивыдвигаемыхгипо
тез.ПоисковаясистемаGoogleможетвыступатьвкачествеаналогакорпуса
текстов при исследовании тех языковых явлений, которые находят отраже
ниевстатистическихрезультатах.Данныйинструментарийособенноэффек
тивен при изучении комбинаторики и вариативности фразы, поскольку
позволяет собрать достаточный по объёму и разнообразию эмпирический
материал,которыйневсегдадоступентрадиционнымкорпусам.
Списоклитературы
1. Бурыкин, А. А.Электронныйресурс для исследованийвобластирусскойлек
сикологии и лексикографии «Библиотека лексикографа»: опыт работы, пер
спективы пополнения, возможности использования [Текст] / А. А. Бурыкин //
Теоретическаяиприкладнаялингвистика.–2015.–Вып. 1.–№ 4.–С. 5–28.
2. Голубкова, Е. Е. Возможности использования корпусов в целях лингвистиче
ского исследования [Текст] / Е. Е. Голубкова. // Магия ИННО: новые измере
ния в лингвистике и дидактике / [oтв. ред. Д. Н. Новиков]. – Т. 1. – M. :
МГИМО–Университет,2017.–С. 394–400.
3. Захаров, В. П. Корпусная лингвистика : учебник [Текст] / В. П. Захаров,
С. Ю. Богданов.–Иркутск :ИГЛУ,2011.–161 с.
4. Квашина, О. С.ИспользованиеGoogleкаксистемыпоискаязыковыхданныхв
вебкорпусе: обучение англоязычной письменной речи [Текст] / О. С. Кваши
на, Ю. П. Ажель // Alma mater (Вестник высшей школы). – 2017. – № 6. –
С. 106–109.
5. Козлова, Н. В.Лингвистическиекорпуса:определениеосновныхпонятийити
пология екст] / Н. В. Козлова // Вестник НГУ. Серия : Лингвистика и меж
культурнаякоммуникация.–2013.–Том11.–Вып. 1.–С. 79–88.
139
Петрова Н. М./ТиПЛ,2019,5(3),127‒142
6. Национальный корпус русского языка лектронный ресурс]. – URL : http://
ruscorpora.ru/(датаобращения:28.11.2018).
7. Манерко, Л. А.Методологическиеосновы использованиякорпусныхданных в
исследованиях по когнитивной лингвистике екст] /Л. А. Манерко // Когни
тивныеисследованияязыка.–2018.–№ 33.–С. 70–78.
8. Мордовин, А. Ю. «Веб как корпус» или «корпус как веб»: новая реальность
корпуснойлингвистики[Текст] / А. Ю. Мордовин//ВестникМГЛУ.–2015.–
№ 3 (714) : Языкознание и литературоведение. Когнитивные аспекты языка и
речи.–С. 163–172.
9. Петрова, И. М. Когнитивный аспект комбинаторики сочинительных парных
словосочетаний в английском и русском языках [Текст] / И. М. Петрова //
Современнаянаука:актуальныепроблемытеорииипрактики.–2018.–№ 9.–
С. 151–156.
10. Петрова, И. М.Комбинаторикабиноминальныхконструкцийкакотражениепро
цесса иконической репрезентации объектов действительности [Текст] /
И. М. Петрова//Когнитивныеисследованияязыка.–2019.–№ 37.–С. 621–625.
11. Рахилина, Е. В. Экспериментальная и корпусная лингвистика: рецензия на
сборникстатейкюбилеюО. А. Сулеймановой«Контенсивныеаспектыязыка:
константностьивариативность»[Текст]/Е. В. Рахилина./ отв.ред.Т. Д. Ша
банова.–М. :Флинта,2016//ВестникМоск.город.пед.унта.Сер. :Филоло
гия.Теорияязыка.Языковоеобразование.–2017.–№ 3 (27).–С. 119–128.
12. Сулейманова, О. А. Использование BIGDATA в экспериментальных лингво
когнитивных исследованиях: анализ семантической структуры глагола
shudder [Текст] / О. А. Сулейманова, В. В. Демченко // Когнитивные исследо
ванияязыка.–2018.–№ 33.–С. 466–472.
13. Сулейманова, О. А. Экспланаторный потенциал теории классов для лингви
стическогоисследования:порядокследованияопределений[Текст]/О. А. Су
лейманова, И. М. Петрова // Филология: научные исследования. – 2018. –
№ 3.–С. 52–64.
14. Чумарина, Г. Р.Ресурсыиарсеналэлектронныхкорпусоввсовременнойлек
сикографии[Текст]/Г. Р. Чумарина//Филологическиенауки.Вопросытеории
ипрактики.–2017.–№ 3–1 (69).–С. 173–175.
15. Fischer, K. Quantitative Methods in Cognitive Semantics. Introduction to the
volume[Text]/ K. Fisher // Quantitative methods in cognitive semantics: corpus
drivenapproaches/D. Glynn,K. Fischer(eds).–Berlin / N.Y. :WalterdeGruyter,
2010.–P. 43–59.
16. Gatto, M. The Web as Corpus: Theory and practice [Text]/ M. G atto.– London,
NewYork :BloomsburyAcademic.–2014.–256 р.
17. Geluso, J.Phraseology and frequency ofoccurrence on the web:native speakers’
perceptions of Google–informed second language writing [Text] / J. Geluso //
ComputerAssistedLanguageLearning.–2013.–№ 26:2.–Р. 144–157.
18. Panah, E. Googleinformed patternhunting and patterndefining: Implication for
language pedagogy [Text] / E. Panah, M. Yunus, M. A. Embi // Asian Social
Science.–2013.–№ 9 (3).–Р. 229–238.
140 Петрова Н. М./ТиПЛ,2019,5(3),127‒142
19. Tummers, J.UsagebasedapproachesinCognitiveLinguistics:Atechnicalstateof
the art [Text] / J. Tummers, K. Heylen, D. Geeraerts // Corpus Linguistics and
LinguisticTheory.–2005.–№ 1(2).–Р. 225–261.
References
1. Burykin, A. A. (2015). Elektronnyy resurs dlya issledovaniy v oblasti russkoy
leksikologii i leksikografii «biblioteka leksikografa»: opyt raboty, perspektivy
popolneniya, vozmozhnosti ispol [Electronic resource for studies in the field of
Russian lexicology and lexicography «Lexicographer's library»: Experience,
outlook for enlarging, possibilities of using]. Teoreticheskaya i prikladnaya
lingvistika[TheoreticalandAppliedLinguistics], 1 (4), 5–28.
2. Golubkova, Е. Е. (2017). Vozmozhnosti ispol'zovaniya korpusov v celyah
lingvisticheskogoissledovaniya[Corporainlinguisticresearch].InD. N. Novikov,
Magiya INNO: novye izmereniya v lingvistike i didaktike [The magic of INNO:
New dimensions in linguistics and didactics] (Vol. 1, pp. 394–400). Moscow :
MGIMOUniversityPress.
3. Zaharov, V. P.,Bogdanova, S. Yu.(2011).Korpusnayalingvistika:uchebnik[Corpus
linguistics:Acoursebook].Irkutsk :IrkutskStateLinguisticUniversity.
4. Kvashina, O. S., Azhel', Yu. P. (2017). Ispol'zovanie Google kak sistemy poiska
yazykovyh dannyh v vebkorpuse: obuchenie angloyazychnoy pis'mennoy rechi
[UsingGoogleasthesystemof searchoflanguagedatainWebcorpus:trainingin
English writing pedagogy]. Alma mater (Vestnik Vysshey Shkoly) [Alma Mater
(HigherSchoolHerald)],6,106–109.
5. Kozlova, N. V. (2013). Lingvisticheskie korpusa: opredelenie osnovnyh ponyatij i
tipologiya [Linguistic corpus: Typology and terms]. NSU Vestnik. Series :
Linguisticsandinterculturalcommunication,11(1),79–88.
6.Russian National Corpus [Digital resource]. Retrieved November 28, 2018 from
<http://ruscorpora.ru/>.
7. Manerko, L. A. (2018). Metodologicheskie osnovy ispol'zovaniya korpusnyh
dannyhvissledovaniyahpokognitivnojlingvistike[Methodologicalfoundationsof
corpus data usage in cognitive linguistics research]. Kognitivnye issledovaniya
yazyka[Cognitivestudiesoflanguage],33,70–78.
8. Mordovin, A. Yu.(2015).«Vebkakkorpus»ili«korpuskakveb»:novayareal'nost'
korpusnoj lingvistiki [«Web as corpus» or «corpus as web»: The new reality of
corpus linguistics]. Vestnik MGLU. Series : Yazykoznanie i literaturovedenie.
Kognitivnyeaspektyyazykairechi[VestnikofMoscowStateLinguisticUniversity.
Linguistics and Literary Studies. Cognitive Aspects of Language and Speech],
3 (714),163–172.
9. Petrova, I. M. (2018). Kognitivnyj aspekt kombinatoriki sochinitel'nyh parnyh
slovosochetanijvanglijskomirusskomyazykah[Cognitiveaspectofcombinatorics
of compositional paired phrases in English and Russian]. Sovremennaya nauka:
aktual'nye problemy teorii i praktiki [Modern science: actual problems of theory
andpractice],9,151–156.
10. Petrova, I. M. (2019). Kombinatorika binominal'nyh konstrukysiy kak otrazhenie
protsessa ikonicheskoy reprezentatsii ob"ektov deystvitel'nosti [Combinatorics of
141
Петрова Н. М./ТиПЛ,2019,5(3),127‒142
binomialphrasesasareflectionoftheprocessoficonicrepresentationofobjects
ofreality].Kognitivnyeissledovaniyayazyka[Cognitivestudiesoflanguage],37,
621–625.
11. Rahilina, Е. V. (2017). Eksperimental'naya i korpusnaya lingvistika: retsenziya na
sbornik statey k yubileyu O. A. Suleymanovoy «Kontensivnye aspekty yazyka:
konstantnost' i variativnost'» [Experimental and corpus linguistics: Review of the
collectionofarticlesfortheanniversaryofO. A. Suleymanova«Contentaspectsof
language: constancy and variability»]. Vestnik Mosk. gorod. ped. unta. Ser:
Filologiya. Teoriya yazyka. Yazykovoe obrazovanie [Vestnik of Moscow City
University. Series : Philology. Theory of language. Language education], 3 (27),
119–128.
12. Souleimanova, O. A., Demchenko, V. V. (2018). Ispol'zovanie BIGDATA v
eksperimental'nyh lingvokognitivnyh issledovaniyah: analiz semanticheskoj
strukturyglagolashudder[Usingbigdatainexperimentallinguocognitivestudies:
Analysisofthesemanticstructure oftheverb shudder].Kognitivnyeissledovaniya
yazyka[Cognitivestudiesoflanguage],33,466–472.
13. Souleimanova, O. A.,Petrova, I. M.(2018).Eksplanatornyjpotencialteoriiklassov
dlya lingvisticheskogo issledovaniya: poryadok sledovaniya opredelenij
[Explanatorypotentialofthe theory of classes forlinguisticresearch:Wordorder
in attributive group]. Filologiya: nauchnye issledovaniya [Philology: Scientific
researches],3,52–64.
14. Chumarina, G. R. (2017). Resursy i arsenal elektronnyh korpusov v sovremennoj
leksikografii [Resources and arsenal of electronic corpora in contemporary
lexicography]. Filologicheskie nauki. Voprosy teorii i praktiki [Philological
Sciences.IssuesofTheoryandPractice],3–1 (69),173–175.
15. Fischer, K. (2010). Quantitative Methods in CognitiveS emantics. Introduction to
the volume. In D. Glynn, K. Fischer (Eds.), Quantitative methods in cognitive
semantics: corpusdriven approaches (pp. 43–59). Berlin / N. Y. : Walter de
Gruyter.
16. Gatto, M.(2014).TheWeb as Corpus: Theoryandpractice.London,NewYork :
BloomsburyAcademic.
17. Geluso, J. (2013). Phraseology and frequency of occurrence on the web: native
speakers’ perceptions of Googleinformed second language writing. Computer
AssistedLanguageLearning,26 (2),144–157.
18. Panah, E., Yunus, M., Embi, M. A. (2013). Googleinformed patternhunting and
patterndefining: Implication for language pedagogy. Asian Social Science, 9 (3),
229–238.
19. Tummers, J., Heylen, K., Geeraerts, D. (2005). Usagebased approaches in
Cognitive Linguistics: A technical state of the art. Corpus Linguistics and
LinguisticTheory,1 (2),225–261.
142 Петрова Н. М./ТиПЛ,2019,5(3),127‒142
Article
В работе рассматриваются сложившиеся практики представления методики исследования на материале авторефератов диссертаций по лингвистическим специальностям. Предлагается критический анализ описаний методов исследования на материале 100 авторефератов по лингвистическим специальностям, выделяются логические когнитивные операции и собственно лингвистические методы, релевантные для проведения исследования. Уточняется экспланаторный потенциал и познавательные установки распространенных лингвистических методов: компонентный анализ, экспериментальные методики, семантический, дискурсивный, когнитивный корпусный анализ. The paper focuses on the current practices in describing research methods in the publications, the empirical data cover 100 abstracts of the theses on linguistics. The authors offer critical analysis of the descriptions and distinguish logical cognitive operations which are universal for the humans in their cognitive activities starting from the early childhood, on the one hand, and linguistic methods per se. The authors define explanatory potential and cognitive backgrounds of the operating linguistic methods, e.g. componential and distributive analyses, experimental techniques, and corpus analysis.
Article
Full-text available
The field of higher education in Russia is undergoing significant changes that require reviewing past practices and professional activities. This article aims to study the potential of using modern digital technologies in linguistic experiments in cognitive linguistics regarding writing master’s degree theses.The analysis of recent cognitive studies has shown that the area for this research is diverse and includes investigating aspects of cognitive semantics, translation techniques, concordance, phrase variability, and others. Research results show that cognitive science widely uses empirical data received through digital technologies such as Google. This digital tool can be accessible and suitable for linguistic experiments and the author demonstrates its application.The paper presents a model of the linguistic experiment on studying the variability of the structure of a conceptual binominal phrase in Russian and English. According to the obtained results, Russian users of the Internet feature a higher tendency for changing the order the binomial concepts than the English-speaking ones. These data provide language material for conclusions and further considerations from a cognitive perspective. The framework of this experiment can be a motivating factor for those who want to master their research and language skills in the magistracy.
Article
Full-text available
The use of the Web as a corpus and Google as a concordancer, has been regarded as one of the promising areas that has a potential for revolutionizing language pedagogy in general, and second language (L2) writing, in particular. More specifically, it is believed that the functions of Google-Informed Pattern-Hunting (GIPH) and Google-Informed Pattern-Defining (GIPD) can promote natural L2 writing through Discovery Learning (DL) and Data Driven Learning (DDL), however, these advantages have mostly been given lip services than tested with first hand empirical studies, and only more recently some studies have been undertaken in this vein. Focusing on L2, this article explored how and to what extent this great potential of GIPH and GIPD has been recognized by reviewing the related studies, thereby some factors and themes (such as Learning Style, Training, Naturalness, Tidiness, Speed, Number of Retrieval, and Proficiency) have been extracted and elaborated on. However, due to the novelty of the area, the themes are mostly the outcome of researchers’ descriptions and interpretations than empirical studies. The inclusion criteria for the present review were studies that focus on the application of the Web as a corpus and Google as a concordance for language learning and L2 writing based on researchers’ and learners’ evaluation of it. Seven studies included in the present review show that learners’ use of GIPH and GIPD champions the promotion of their language learning and L2 writing, providing that proper training and scaffolding are provided. Future studies are also recommended based on the gaps and deficiencies identified in the reviewed researches.
Article
This paper presents a technical state of the art in usage-based linguistics as defined in the context of Cognitive Linguistics. Starting from actual case studies rather than theoretical assumptions, methodological issues concerning the usage-based approach are addressed, with specific reference to the use of corpus materials. The specific methodological identity of usage-based linguistics is described in terms of data gathering strategies and the status of empirical data in linguistic research. From a delineation of corpus research in contrast with introspection, survey research, and experimentation, two criteria emerge as essential for a genuine corpus-oriented usage-based linguistics, viz. the use of quantitative techniques and the systematic operationalization of research hypotheses. It is suggested that paying closer attention to these methodological issues is a prerequisite for the further development of the usage-based approach in Cognitive Linguistics.
Article
Usage-based theories of language learning suggest that native speakers of a language are acutely aware of formulaic language due in large part to frequency effects. Corpora and data-driven learning can offer useful insights into frequent patterns of naturally occurring language to second/foreign language learners who, unlike native speakers, are not privy to a lifetime of input and fine-tuning. Recently, the use of the web in combination with the Google search engine as an accessible corpus and concordancer has received much attention. This article describes an experiment which tests the hypothesis that native speakers of English perceive learner-generated phrases to be more natural after learners have searched the phrases on Google and modified them in light of the frequency of search results. The findings indicate that native speakers perceive phrases that generated more results in Google searches to be more natural.
Электронный ресурс для исследований в области русской лек сикологии и лексикографии «Библиотека лексикографа»: опыт работы, пер спективы пополнения, возможности использования
  • А А Бурыкин
Бурыкин, А. А. Электронный ресурс для исследований в области русской лек сикологии и лексикографии «Библиотека лексикографа»: опыт работы, пер спективы пополнения, возможности использования [Текст] / А. А. Бурыкин // Теоретическая и прикладная лингвистика. -2015. -Вып. 1. -№ 4. -С. 5-28.
Возможности использования корпусов в целях лингвистиче ского исследования
  • Е Е Голубкова
Голубкова, Е. Е. Возможности использования корпусов в целях лингвистиче ского исследования [Текст] / Е. Е. Голубкова. // Магия ИННО: новые измере ния в лингвистике и дидактике / [oтв. ред. Д. Н. Новиков]. -Т. 1. -M. : МГИМО-Университет, 2017. -С. 394-400.
Корпусная лингвистика : учебник
  • В П Захаров
Захаров, В. П. Корпусная лингвистика : учебник [Текст] / В. П. Захаров, С. Ю. Богданов. -Иркутск : ИГЛУ, 2011. -161 с.
Google как системы поиска языковых данных в вебкорпусе: обучение англоязычной письменной речи
  • О С Квашина
  • Использование
Квашина, О. С. Использование Google как системы поиска языковых данных в вебкорпусе: обучение англоязычной письменной речи [Текст] / О. С. Кваши на, Ю. П. Ажель // Alma mater (Вестник высшей школы). -2017. -№ 6. -С. 106-109.
Лингвистические корпуса: определение основных понятий и ти пология
  • Н В Козлова
Козлова, Н. В. Лингвистические корпуса: определение основных понятий и ти пология [Текст] / Н. В. Козлова // Вестник НГУ. Серия : Лингвистика и меж культурная коммуникация. -2013. -Том 11. -Вып. 1. -С. 79-88.
Методологические основы использования корпусных данных в исследованиях по когнитивной лингвистике
  • Л А Манерко
Манерко, Л. А. Методологические основы использования корпусных данных в исследованиях по когнитивной лингвистике [Текст] /Л. А. Манерко // Когни тивные исследования языка. -2018. -№ 33. -С. 70-78.