Mar a chleachdas tu 'Ngram Viewer' Inneal ann an Leabhraichean Ghoogle

Is e Ngram, ris an canar cuideachd N-gram, anailis staitistigeil air susbaint teacsa no cainnt gus lorg n (àireamh) de sheòrsa de rudan anns an teacsa. Dh'fhaodadh e a bhith ann an diofar seòrsa rudan, mar phonemes, ro-leasachan, abairtean no litrichean. Ged a tha an N-gram beagan ceàrr taobh a-muigh an neach-rannsachaidh, tha e air a chleachdadh ann an caochladh raointean, agus tha mòran buaidh aige air daoine a tha a 'dèanamh phrògraman coimpiutair a tha a' tuigsinn agus a 'freagairt le cànan nàdarra. Sin, gu ìre mhòr, gum biodh ùidh aig Google anns a 'bheachd.

Ann an cùis leabhraichean Google Ngram Viewer, tha an teacsa a thèid a sgrùdadh a 'tighinn bhon mhòr-chuid de leabhraichean. Tha Google air a sganadh bho leabharlannan poblach gus an inneal rannsachaidh Google Books aca. Airson Leabhraichean Ghoogle Ngram Viewer, tha iad a 'toirt iomradh air an teacsa a tha thu a' dol a rannsachadh mar "corpus." Tha an corporra anns an Ngram Viewer air a roinn le cànan, ged as urrainn dhut Beurla Breatannach is Ameireaganaich a sgrùdadh no an cuir còmhla iad. Tha e deiseil gu math inntinneach a bhith a 'gluasad bho chleachdadh Breatannach gu Ameireaganach de theirmean agus faic na cairtean atharrachadh.

Mar a tha Ngram ag obair

  1. Rach gu Leabhraichean Ghoogle Ngram Viewer aig books.google.com/ngrams.
  2. Tha na h-artaigilean mothachail air cùis, an taca ri rannsachaidhean lìn Ghoogle, mar sin bi cinnteach gum bi iad a 'gabhail brath air ainmearan ceart.
  3. Clàraich a-steach abairt no abairtean sam bith a tha thu airson anailis a dhèanamh. Dèan cinnteach gun sgaradh gach abairt le cromag. Tha Google a 'moladh, "Albert Einstein, Sherlock Holmes, Frankenstein" gus do thòiseachadh.
  4. An ath rud, tagh a-steach sreath cinn-latha. Is e am bunait eadar 1800 agus 2000, ach tha leabhraichean nas ùire (b 'e 2011 an liosta as ùire air pàipearan Ghoogle, ach dh'fhaodadh gun do dh'atharraich sin.)
  5. Tagh corpas. Faodaidh tu rannsachadh teacsaichean cànain sa Bheurla no Beurla, agus a bharrachd air na roghainnean àbhaisteach, is dòcha gu bheil thu a 'faicinn rudan mar "Beurla (2009) no Beurla Ameireaganach (2009)" aig a' bhonn. Is e sin corpora nas sine a tha Google air ùrachadh, ach dh'fhaodadh gum bi adhbhar agad airson do choimeasan a dhèanamh an aghaidh seann sheataichean dàta. Faodaidh a 'chuid as motha de luchd-cleachdaidh an aire a thoirt dhaibh agus cuideam a chur air a' chorpra as ùire.
  6. Suidhich an ìre deiseil agad. Tha smoothing a 'toirt iomradh air dè cho rèidh' sa tha an graf aig an deireadh. Is e an riochdachadh as cinntiche ìre luadhaidh de 0, ach dh'fhaodadh gum bi e doirbh a leughadh. Tha am bunait stèidhichte gu 3. Anns a 'mhòr-chuid de chùisean, chan fheum thu seo atharrachadh.
  1. Brùth air a ' phutan Lorg tòrr leabhraichean . (Faodaidh tu dìreach inntrigeadh a-steach aig an t-slat rannsachaidh.)

Dè tha Ngram a 'sealltainn?

Bidh Google Books Ngram Viewer a 'toirt a-mach graf a tha a' riochdachadh cleachdadh abairt sònraichte ann an leabhraichean tro ùine. Ma tha thu air barrachd air aon fhacal no abairt a chur a-steach, chì thu loidhnichean còd datha gus na diofar fhaclan luirg a chòmhdach. Tha seo gu math coltach ri Toraidhean Ghoogle , ach tha an rannsachadh a 'còmhdach ùine nas fhaide.

Seo eisimpleir fìor mhath. Bha sinn duilich mu dheidhinn pasgan fìonag o chionn ghoirid. Tha iad air an ainmeachadh ann an Taigh Little Laura Ingalls Wilder air sreath nam Prairie , ach cha chuala sinn a-riamh mu rud mar sin. Chleachd sinn an rannsachadh lìn Ghoogle an toiseach airson barrachd ionnsachadh mu bhiastagan fìonag. A rèir coltais, thathas den bheachd gu bheil iad nam pàirt de bhiadh ann an Ameireaganaich a Deas agus gu dearbh tha iad air an dèanamh à fìonag. Bidh iad ag èisteachd air ais gu amannan nuair nach robh cothrom aig a h-uile duine air bathar ùr fad na bliadhna. An e sin an sgeulachd gu lèir?

Rannsaich sinn Google Ngram Viewer, agus tha cuid de chomharraidhean air an t-sìde anns an dà chuid tràth is deireadh nan 1800an, tha mòran a 'toirt iomradh anns na 1940an, agus tha barrachd is barrachd iomradh orra o chionn ghoirid (' s dòcha cuid de chianalas). duilgheadas leis an dàta aig ìre deiseachaidh de 3. Tha raon mòr thairis air na tha ea 'toirt iomradh anns na 1800an. Gu cinnteach nach robh àireamh cho-ionann ann de aon pìos sònraichte gach bliadhna airson còig bliadhna? Is e an rud a tha a 'dol air adhart sin a chionn' s nach eil mòran leabhraichean air am foillseachadh aig an àm sin, agus seach gu bheil an dàta againn air a chur sìos gu rèidh, cuiridh e an dealbh air falbh. Is dòcha gu robh aon leabhar ann a bha a 'toirt iomradh air pìos vinegar, agus bha e dìreach gu leòr airson spike a sheachnadh. Le bhith a 'suidheachadh a' ghlanadh gu 0, chì sinn gu bheil seo fìor. Tha an spìop ag ionadachadh air 1869, agus tha spike eile ann an 1897 agus 1900.

An do bhruidhinn duine mu dheidhinn fìonag a 'biathadh an còrr den ùine? Is dòcha gu robh iad a 'bruidhinn mu na pasgan sin. Tha e coltach gum bi reasabaidhean a ' gluasad air feadh an àite. Cha robh iad dìreach a ' sgrìobhadh mu dheidhinn ann an leabhraichean, agus tha sin na chuingealachadh air na ngraman sin.

Searraidhean Ngram adhartach

Cuimhnich mar a thuirt sinn gum faodadh Ngrams a bhith a 'gabhail a-steach gach seòrsa rannsachadh teacsa eadar-dhealaichte? Tha Google a 'leigeil leat a bhith a' drileadh sìos gu math leis an Ngram Viewer cuideachd. Ma tha thu airson iasg a lorg, bidh an gnìomhair an àite ainmear iasg, is urrainn dhut sin a dhèanamh le bhith a 'cleachdadh tags. Anns a 'chùis seo, bhiodh tu a' lorg "fish_VERB"

Tha Google a 'toirt liosta iomlan de dh' òrduighean as urrainn dhut a chleachdadh agus sgrìobhainnean adhartach eile air an làrach-lìn aca.