Kiel Uzi 'Ngram Viewer' Ilo en Google Books

Ngramo, ankaŭ ofte nomata N-gramo, estas statistika analizo de teksto aŭ parola enhavo por trovi n (nombro) de ia speco de ero en la teksto. Ĝi povus esti ĉiuj specoj de aferoj, kiel fonemoj, prefiksoj, frazoj aŭ literoj. Kvankam la N-gramo estas iom malklara ekster la esploristo, ĝi estas fakte uzata en diversaj kampoj, kaj ĝi havas multajn implikaĵojn por homoj, kiuj faras komputilprogramojn, kiuj komprenas kaj respondas per natura parola lingvo. Tio, en malmultaj vortoj, estus la intereso de Google en la ideo.

En la kazo de Google Books Ngram Viewer, la teksto analizita venas de la vasta kvanto da libroj, kiujn Google scanigis de publikaj bibliotekoj por popoli sian serĉilon de Google Books . Por Google Books Ngram Viewer, ili raportas al la teksto, kiun vi serĉos kiel "korpuso". La korpa en Ngram Viewer estas dividita per lingvo, kvankam vi povas aparte analizi la britan kaj usonan anglan aŭ kunmeti ilin kune. Ĝi finas esti súper interesa por ebligi de brita al usona uzado de terminoj kaj vidi la leterojn ŝanĝi.

Kiel Ngram Funkcias

  1. Iru al Google Books Ngram Viewer ĉe books.google.com/ngrams.
  2. Eroj estas kaze-sentemaj, kontraste kun Google-serĉaj serĉoj, do certu, ke vi rajtigu proprajn substantivojn.
  3. Tajpu iun ajn frazon aŭ frazojn, kiujn vi volas analizi. Certigu apartigi ĉiun frazon per komo. Google sugestas, "Albert Einstein, Sherlock Holmes, Frankenstein" por ke vi komencu.
  4. Tuj poste, enmetu daton-gamon. La defaŭlta estas 1800 ĝis 2000, sed ekzistas pli freŝaj libroj (2011 estis la plej lastatempa listigita en la dokumentado de Google, sed tio eble ŝanĝiĝis.)
  5. Elektu korpumon. Vi povas serĉi fremdajn lingvajn tekstojn aŭ anglajn, kaj krom la normaj elektoj, vi povas rimarki aferojn kiel "Angla (2009) aŭ amerika Angla (2009)" ĉe la fundo. Ĉi tiuj estas pli malnovaj korpoj, kiujn Google jam ĝisdatigis, sed vi eble havas iujn kialojn por fari viajn komparojn kontraŭ malnovaj datumaj aroj. Plej multaj uzantoj povas ignori ilin kaj fokusiĝi en la plej freŝa korpo.
  6. Ŝanĝu vian trankviligan nivelon. Smoothing raportas al kiom glata la grafikaĵo estas al la fino. La plej preciza reprezento estus svelta nivelo de 0, sed tio eble malfacilas legi. La defaŭlta estas aro 3. Plejparte, vi ne bezonas ĝustigi ĉi tion.
  1. Premu la serĉon de multaj butonoj de libroj . (Vi ankaŭ povas nur bati eniri ĉe la serĉprogramo.)

Kion Ngramo Montras?

Google Books Ngram Viewer elsendos grafeon, kiu reprezentas la uzon de aparta frazo en libroj per tempo. Se vi eniris pli ol unu vorton aŭ frazon, vi vidos kolorkodajn liniojn por kontrasti la malsamajn serĉajn terminojn. Ĉi tio estas sufiĉe simila al Google Trends , nur la serĉo kovras pli longan tempon.

Jen vera ekzemplo. Ni estis scivolaj pri vinagraj kukaĵoj ĵus. Ili estas menciitaj en la malgranda domo de Laura Ingalls Wilder sur la Prairie serio, sed ni neniam aŭdis pri tia afero. Ni unue uzis la TTT-serĉon de Google por lerni pli pri vinagraj kukaĵoj. Ŝajne ili konsideras parton de amerika Suda kuirarto kaj vere estas faritaj el vinagro. Ili aŭskultas reen al tempoj, kiam ĉiuj ne aliris al freŝa produkto en ĉiuj tempoj de la jaro. Ĉu tio estas la tuta historio?

Ni serĉis Google Ngram Viewer, kaj estas iuj mencioj de la kukaĵo en la fruaj kaj malfruaj 1800-aj jaroj, multajn menciojn en la 1940-aj jaroj, kaj kreskanta nombro da mencioj en la lastaj tempoj (eble kelkaj kukaĵoj de nostalgio) Nu, jen iuj problemo kun la datumoj ĉe eleganta nivelo de 3. Ekzistas altebenaĵo super la mencioj en la 1800-aj jaroj. Verŝajne ne estis egalaj nomoj de unu aparta kukaĵo ĉiun jaron dum kvin jaroj? Kio okazas estas ĉar ne multaj libroj publikiĝis dum tiu tempo, kaj ĉar niaj datumoj estas ĝustigitaj, ĝi distorsas la bildon. Verŝajne estis unu libro, kiu menciis vinagran kukaĵon, kaj ĝi nur akiris averaĝe por eviti pikilon. Per la ĝustigo de 0, ni povas vidi, ke ĉi tio estas ĝuste la kazo. La spiko centras en 1869, kaj ekzistas alia pikilo en 1897 kaj 1900.

Ĉu neniu parolis pri vinagro kuŝas la reston de la tempo? Ili verŝajne parolis pri tiuj kukaĵoj. Probablaj receptoj flosas tra la tuta loko. Ili simple ne skribis pri ili en libroj, kaj tio estas limigo de tiuj serĉoj de Ngram.

Altnivelaj Ngramaj Serĉoj

Memoru, kiel ni diris, ke Ngramoj povus konsisti el ĉiuj specoj de malsamaj tekstaj serĉoj? Google ankaŭ permesas vin perdi iomete kun la Ngram Viewer. Se vi ŝatus serĉi fiŝon la verbo anstataŭ fiŝi la substantivon, vi povas fari ĝin per uzado de etikedoj. En ĉi tiu kazo, vi serĉos "fish_VERB"

Google provizas kompletan liston de komandoj, kiujn vi povas uzi kaj aliaj antaŭaj dokumentoj en ilia retejo.