1.13. Eksperimentelle tjenester#

from dhlab.future.corpus_conc_coll import Corpus, Concordance, Collocations, Frequencies
c = Corpus.build(doctype="digibok")
c.head(2)
dhlabid urn title authors oaiid sesamid isbn10 city timestamp year publisher langs subjects ddc genres literaryform doctype ocr_creator ocr_timestamp
0 100101896 URN:NBN:no-nb_digibok_2012081608178 Folke- og boligtelling 1. november 1980 : Komm... oai:nb.bibsys.no:999401994084702202 f70229d2e71fa8286ee50d5eb8a54dc1 8253713118 19810101 1981 Statistisk sentralbyrå nob Boligstatistikk / Norge / Befolkningsstatistik... Faglitteratur digibok nb 20060101
1 100105758 URN:NBN:no-nb_digibok_2012090408091 Nordisk konferanse om miljølære i den høyere a... oai:nb.bibsys.no:999612742804702202 9320556bf45f3090f9f2f1c70f862857 København 19810101 1981 Nordisk ministerråd, Sekretariatet for nordisk... mul / dan / nob / swe conference publication Faglitteratur digibok nb 20060101
c.get_freqs().display_names()
Fortellingene om Teskjekjerringa Opgaver til forberedende geometriske øvelser Using personnel to develop networks : an approach to subsidiary management Fire salmetoner Folke- og boligtelling 1. november 1980 : Kommunehefte 1134 Suldal Nordisk konferanse om miljølære i den høyere agronomutdanning : konferanserapport : Kolle Kolle, Værløse 28-30 august 1981 Verkstedpermen : mekaniske fag : grunnkurs : ... forslag til løsninger Valet er ditt! : ungdom, utdanning og kjønnsroller Identitet BFF : bestevenner for alltid
, 3671.0 195.0 356.0 44.0 468.0 3097.0 552.0 234.0 2160.0 59.0
. 2835.0 456.0 280.0 26.0 581.0 4340.0 1902.0 293.0 1656.0 187.0
og 2165.0 215.0 18.0 11.0 191.0 1351.0 337.0 215.0 867.0 17.0
« 1720.0 2.0 1.0 3.0 36.0 41.0 128.0 2.0 56.0 32.0
» 1714.0 5.0 0.0 0.0 49.0 23.0 90.0 4.0 56.0 38.0
... ... ... ... ... ... ... ... ... ... ...
vinnes 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 2.0
ANNE 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 3.0
Zebra 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 3.0
WILLIAM 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 4.0
UKJENT 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 0.0 9.0

34293 rows × 10 columns

c.get_freqs().sum_freqs()
frequencies
, 10836.0
. 12556.0
og 5387.0
« 2021.0
» 1979.0
... ...
vinnes 2.0
ANNE 3.0
Zebra 3.0
WILLIAM 4.0
UKJENT 9.0

34293 rows × 1 columns

Concordance.get_concordances(corpus=c, words="konge").head()
docid urn concordance link
0 100151118 URN:NBN:no-nb_digibok_2008092900026 « Ja , det er jeg sikker på , » sa kjerringa ,... <a target='_blank' href = 'https://urn.nb.no/U...
1 100436814 URN:NBN:no-nb_digibok_2021021607524 ... Ordet « liv » er ordenes <b>konge</b> . Or... <a target='_blank' href = 'https://urn.nb.no/U...
Collocations.get_collocations(corpus=c, words=["konge", "kongeriket"])
counts
ordenes 1.0
. 3.0
Ordkongen 1.0
, 5.0
Ordet 2.0
» 1.0
greier 1.0
omgitt 1.0
liv 1.0
som 1.0
å 1.0
du 3.0
av 1.0
ikke 1.0
styre 1.0
er 2.0
lysta 1.0
andre 2.0
di 1.0
store 1.0
men 1.0
livet 1.0
ord 1.0
og 1.0
til 1.0
1.0
hyllesten 1.0
« 2.0