{
"cells": [
{
"attachments": {},
"cell_type": "markdown",
"metadata": {},
"source": [
""
]
},
{
"attachments": {},
"cell_type": "markdown",
"metadata": {},
"source": [
"# Konkordanser"
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [],
"source": [
"import dhlab as dh"
]
},
{
"attachments": {},
"cell_type": "markdown",
"metadata": {
"slideshow": {
"slide_type": "slide"
}
},
"source": [
"## Konkordans med og uten korpus\n",
"\n",
"For å sjekke konkordanser i bøker og aviser benyttes kommandoen `concordance()`\n"
]
},
{
"attachments": {},
"cell_type": "markdown",
"metadata": {},
"source": [
"### Konkordans fra aviser"
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"
\n",
" \n",
" \n",
" | \n",
" link | \n",
" concordance | \n",
"
\n",
" \n",
" \n",
" \n",
" 5 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19650408_73_83_1 | \n",
" ... vite at dette sft langt fra er tilfelle . Demokrati er retten til ft kunne velge selv , til fl... | \n",
"
\n",
" \n",
" 15 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_20080801_116_176_1 | \n",
" ... Estetisk er begrepet forbundet med funksjonalitet og enkelhet , politisk med likhet og demokrati . Det er interessant at det... | \n",
"
\n",
" \n",
" 11 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19650408_73_83_1 | \n",
" ... Men bruker et demokrati makt , har det etter min oppfatning ingen rett til å kalle seg for et demokrati... | \n",
"
\n",
" \n",
" 3 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_20080801_116_176_1 | \n",
" ■ Bompenger og demokrati | \n",
"
\n",
" \n",
" 13 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19650408_73_83_1 | \n",
" ... Det gir oss eit demokrati som er levande og gjer at folk handlar under ansvar . Dei avvikande meiningane er... | \n",
"
\n",
" \n",
" 6 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19891007_97_231_1 | \n",
" ... Men folks vilje til frihet og demokrati kan ingen stoppe selv om det kan se stygt ut . Jeg lar... | \n",
"
\n",
" \n",
" 10 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19610228_69_50_1 | \n",
" ... Det er det vi pleier kalle demokrati . Det får ikke hjelpe om Per Thomsen nevner navn som Gerhardsen ,... | \n",
"
\n",
" \n",
" 1 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19650515_73_111_1 | \n",
" ... 20 05 Industrielt demokrati . Den personlige medvirkning i bedriften . Foredrag av dosent Einar Thorsrud . 20 25 Ludwig... | \n",
"
\n",
" \n",
" 4 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_20061205_114_283_1 | \n",
" ... Uten forbedringer på russisk side når det gjelder respekt for menneskerettigheter , rettssikkerhet og demokrati , vil nordområdepolitikken ikke kunne... | \n",
"
\n",
" \n",
" 9 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19650515_73_111_1 | \n",
" ... - • Thorsrud i forbin- KraTl deise med temaet Industrielt demokrati om den personlige medvirkning i bedriften . Dosent Einar Thorsrud... | \n",
"
\n",
" \n",
"
\n"
],
"text/plain": [
""
]
},
"execution_count": 2,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"#Bygg aviskorpus med aviser som begynner med 'stavanger' utgitt fra 1960\n",
"aviskorpus = dh.Corpus(doctype=\"digavis\", title=\"stavanger*\", from_year=1960, limit=10)\n",
"\n",
"# Finn konkordanser i korpus\n",
"# Vis med .show()\n",
"dh.Concordance(corpus=aviskorpus, query=\"demokrati\").show()"
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
" \n",
" \n",
" | \n",
" link | \n",
" concordance | \n",
"
\n",
" \n",
" \n",
" \n",
" 2 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_20081122_116_273_1 | \n",
" ... Rådmannen ville avgrense utredningen til å ta for seg økonomi og demokrati ved en sammenslåing , men formannskapet ga sterke... | \n",
"
\n",
" \n",
" 14 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19940514_102_109_1 | \n",
" ... Dersom vi aksepterer at mediebedrifter også har en viktig , vitaliserende funksjon i et liberalt demokrati , er det da... | \n",
"
\n",
" \n",
" 1 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19711004_79_229_1 | \n",
" ... det praktiske for demokrati pft arbeidsplassen . » Revolusjonerende NYHET Til motet innbyr vi : _ , 0 • 1 . • I... | \n",
"
\n",
" \n",
" 6 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19970919_105_216_1 | \n",
" ... Det er en illeluktende uting i vårt demokrati at pengesterke private sammenslutninger av typen LO og NHO skal kjøpe seg... | \n",
"
\n",
" \n",
" 5 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_20081122_116_273_1 | \n",
" ... Méns kanonene drønnet og Europa ble lagt i ruiner , ga han ut boken « Kapitalisme , sosialisme og demokrati » .... | \n",
"
\n",
" \n",
" 0 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19940514_102_109_1 | \n",
" ... Slik fungerer et demokrati , og det er bortkastet å ikke stemme . | \n",
"
\n",
" \n",
" 3 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19981107_106_259_1 | \n",
" ... I dag lever vi i et åpent demokrati med mange institusjoner som barnevern , sosialkontor og så videre , som... | \n",
"
\n",
" \n",
" 4 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19711004_79_229_1 | \n",
" ... Under sine studier ble han imidlertid overbevist om at sosialisering og demokrati vanskelig kunne forenes . Han tok konsekvensen av... | \n",
"
\n",
" \n",
" 7 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19981107_106_259_1 | \n",
" ... Uten åpenhet får vi ikke demokrati , sier Eikesdal til Aftenbladet . Hun kritiserer både Utenriksdepartementet , Samferdselsdepartementet og Miljøverndepartementet... | \n",
"
\n",
" \n",
" 8 | \n",
" URN:NBN:no-nb_digavis_stavangeraftenblad_null_null_19981107_106_259_1 | \n",
" - Uten åpenhet får vi ikke demokrati | \n",
"
\n",
" \n",
"
\n"
],
"text/plain": [
""
]
},
"execution_count": 3,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# Alternavtivt kan man finne konkordanser direkte fra et Corpus objekt via `.conc` \n",
"\n",
"dh.Corpus(doctype=\"digavis\", title=\"stavanger*\", from_year=1960, limit=10).conc(\"demokrati\").show()"
]
},
{
"attachments": {},
"cell_type": "markdown",
"metadata": {},
"source": [
"### Fri konkordans fra bøker"
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
" \n",
" \n",
" | \n",
" link | \n",
" concordance | \n",
"
\n",
" \n",
" \n",
" \n",
" 13 | \n",
" URN:NBN:no-nb_digibok_2009062204035 | \n",
" ... , ville de blive et mægtigt Middel til at udbrede og befordre Handel , Vinskibelighed , Dannelse og Velvære . | \n",
"
\n",
" \n",
" 10 | \n",
" URN:NBN:no-nb_digibok_2010031003056 | \n",
" ... , Fabrik- og Manufakturfliden , samt ved at udbrede Vinskibelighed i dens forskjellige Grene . For at udbrede nyttig Kundskab... | \n",
"
\n",
" \n",
"
\n"
],
"text/plain": [
""
]
},
"execution_count": 4,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# Bygg korpus med bøker som nevner \"Vinskibelighed\" mellom 1600 og 1850\n",
"bokkorpus = dh.Corpus(doctype=\"digibok\", fulltext=\"Vinskibelighed\", from_year=1600, to_year=1850, limit=20)\n",
"\n",
"# Finn konkordanser from 'Vinskibelighet'. Vis med '.show()'\n",
"dh.Concordance(corpus=bokkorpus, query=\"Vinskibelighed\").show(2)"
]
},
{
"attachments": {},
"cell_type": "markdown",
"metadata": {},
"source": [
"### Konkordans med stort definert korpus\n",
"\n",
"Her bygger vi først et korpus. Se eksempelfil om [Korpusbygging](https://nbviewer.jupyter.org/github/DH-LAB-NB/DHLAB/blob/master/1_Bygg_korpus.ipynb) for ulike måter å definere korpus."
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {},
"outputs": [],
"source": [
"korpus = dh.Corpus(doctype=\"digibok\", fulltext='kvinner', ddk=\"33*\", from_year=1960, to_year=1970, limit=400)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Undersøk lengden på korpuset med `.size`"
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [
{
"data": {
"text/plain": [
"330"
]
},
"execution_count": 6,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"korpus.size"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Vi kan dra ut et delkorpus for søkeformål med `.sample()`"
]
},
{
"cell_type": "code",
"execution_count": 7,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
"
\n",
" \n",
" \n",
" | \n",
" dhlabid | \n",
" urn | \n",
" title | \n",
" authors | \n",
" oaiid | \n",
" sesamid | \n",
" isbn10 | \n",
" city | \n",
" timestamp | \n",
" year | \n",
" publisher | \n",
" langs | \n",
" subjects | \n",
" ddc | \n",
" genres | \n",
" literaryform | \n",
" doctype | \n",
"
\n",
" \n",
" \n",
" \n",
" 60 | \n",
" 100042390 | \n",
" URN:NBN:no-nb_digibok_2011022106011 | \n",
" Hva er sosialisme? : et opplegg til studier og... | \n",
" Zachariassen , Aksel | \n",
" oai:nb.bibsys.no:990308860314702202 | \n",
" 4d0e0ebd386de1f2ba8ef73681260752 | \n",
" | \n",
" <Oslo> | \n",
" 19650101 | \n",
" 1965 | \n",
" Arbeidernes opplysningsforbund | \n",
" nob | \n",
" | \n",
" 335 | \n",
" | \n",
" Faglitteratur | \n",
" digibok | \n",
"
\n",
" \n",
" 152 | \n",
" 100277440 | \n",
" URN:NBN:no-nb_digibok_2016011848034 | \n",
" Lyngdals sparebank : 1864 - 1964 : bygd og ban... | \n",
" Salen , Odd / Fahlstrøm , Kristian | \n",
" oai:nb.bibsys.no:999705880464702202 | \n",
" e3c9259dcd1b288b4c24c4ea268ea3dc | \n",
" | \n",
" | \n",
" 19640101 | \n",
" 1964 | \n",
" Banken | \n",
" nob | \n",
" Bygdebøker / Sparebanker / Historisk framstill... | \n",
" 332.2 | \n",
" | \n",
" Faglitteratur | \n",
" digibok | \n",
"
\n",
" \n",
"
\n",
"
"
],
"text/plain": [
" dhlabid urn \\\n",
"60 100042390 URN:NBN:no-nb_digibok_2011022106011 \n",
"152 100277440 URN:NBN:no-nb_digibok_2016011848034 \n",
"\n",
" title \\\n",
"60 Hva er sosialisme? : et opplegg til studier og... \n",
"152 Lyngdals sparebank : 1864 - 1964 : bygd og ban... \n",
"\n",
" authors oaiid \\\n",
"60 Zachariassen , Aksel oai:nb.bibsys.no:990308860314702202 \n",
"152 Salen , Odd / Fahlstrøm , Kristian oai:nb.bibsys.no:999705880464702202 \n",
"\n",
" sesamid isbn10 city timestamp year \\\n",
"60 4d0e0ebd386de1f2ba8ef73681260752 19650101 1965 \n",
"152 e3c9259dcd1b288b4c24c4ea268ea3dc 19640101 1964 \n",
"\n",
" publisher langs \\\n",
"60 Arbeidernes opplysningsforbund nob \n",
"152 Banken nob \n",
"\n",
" subjects ddc genres \\\n",
"60 335 \n",
"152 Bygdebøker / Sparebanker / Historisk framstill... 332.2 \n",
"\n",
" literaryform doctype \n",
"60 Faglitteratur digibok \n",
"152 Faglitteratur digibok "
]
},
"execution_count": 7,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"korpus.corpus.sample(2)"
]
},
{
"cell_type": "code",
"execution_count": 8,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
" \n",
" \n",
" | \n",
" link | \n",
" concordance | \n",
"
\n",
" \n",
" \n",
" \n",
" 212 | \n",
" URN:NBN:no-nb_digibok_2012080909523 | \n",
" ... Aldersgrupperingen for barn 0 - 10 år er om regnet til to 5 - års grupper , istedenfor tre j-års... | \n",
"
\n",
" \n",
" 62 | \n",
" URN:NBN:no-nb_digibok_2007072401037 | \n",
" ... For det første er det i dag langt flere barn som lever opp og når forplantningsdyktig alder . Den gjennomsnittlige... | \n",
"
\n",
" \n",
" 43 | \n",
" URN:NBN:no-nb_digibok_2013040408064 | \n",
" ... Denne sanking var for størstedelen overlatt til kvinner og barn da mennene nettopp i sankingstiden søkte ut på sommerfisket ,... | \n",
"
\n",
" \n",
" 76 | \n",
" URN:NBN:no-nb_digibok_2016081208144 | \n",
" ... Utleie av sports- og turutstyr , båtutleie , fjellførere , skilærere , fiskelærere , sommerskoler for barn og voksne o... | \n",
"
\n",
" \n",
" 195 | \n",
" URN:NBN:no-nb_digibok_2015021006004 | \n",
" for mann og kvinne må realiseres . Ungdom og barn må få en nyttig utdannelse | \n",
"
\n",
" \n",
" 75 | \n",
" URN:NBN:no-nb_digibok_2007052201042 | \n",
" ... Barnetrygd og forsørgertrygd for barn . Family allowances and survivors benefitjor children . . . Syketrygd . Health Insurance ....... | \n",
"
\n",
" \n",
" 38 | \n",
" URN:NBN:no-nb_digibok_2017010648120 | \n",
" ... Det var samtidig fastsatt i loven at feriegodtgjøringen skulle tilfalle ektefelle eller barn som arbeidstakeren forsørger . Hadde han ingen... | \n",
"
\n",
" \n",
" 46 | \n",
" URN:NBN:no-nb_digibok_2010111606071 | \n",
" ... Det samme når vi får barn , eller når vi dør . Samfunnet er omfattende og griper inn i alle... | \n",
"
\n",
" \n",
" 193 | \n",
" URN:NBN:no-nb_digibok_2018020248276 | \n",
" Som tilfellet oftest er med embedsmanns barn , kom Wolff under sin oppvekst til å flytte med foreldrene rundt omkring... | \n",
"
\n",
" \n",
" 110 | \n",
" URN:NBN:no-nb_digibok_2006081100018 | \n",
" ... i Ispet av mel ! omkligBtilia die ett og to barn pr. tamilie nelt normalt i arbsicler- KI2BBSN . og... | \n",
"
\n",
" \n",
"
\n"
],
"text/plain": [
""
]
},
"execution_count": 8,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"# Konkordans fra sample\n",
"dh.Concordance(corpus=korpus.corpus.sample(50), query=\"barn\").show()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Flere ord eller ordformer kan søkes etter på en gang. Bruk 'OR' for å separerer ordene."
]
},
{
"cell_type": "code",
"execution_count": 9,
"metadata": {},
"outputs": [
{
"data": {
"text/html": [
"\n",
"\n",
" \n",
" \n",
" | \n",
" link | \n",
" concordance | \n",
"
\n",
" \n",
" \n",
" \n",
" 263 | \n",
" URN:NBN:no-nb_digibok_2015030906010 | \n",
" ... 53 000 nye elever ved skolen og rettet ca. 320 000 oppgåvesvar . | \n",
"
\n",
" \n",
" 272 | \n",
" URN:NBN:no-nb_digibok_2008052304020 | \n",
" forholdsvis flest menn som tok utdannelse , mens det i Finnmark var flest kvinner som gikk på skole . Helt... | \n",
"
\n",
" \n",
" 488 | \n",
" URN:NBN:no-nb_digibok_2014101406034 | \n",
" I Steinf.jord er skolen udelt og betjenes av en student . I 1966 var det 12 elever . Tallet vil... | \n",
"
\n",
" \n",
" 195 | \n",
" URN:NBN:no-nb_digibok_2017112048006 | \n",
" 1 1948 ble Luftforsvarets våpentekniske skole etablert på Lista . 1 årene som fulgte måtte skolen utvides flere ganger for... | \n",
"
\n",
" \n",
" 23 | \n",
" URN:NBN:no-nb_digibok_2017030248024 | \n",
" skole | \n",
"
\n",
" \n",
" 433 | \n",
" URN:NBN:no-nb_digibok_2017120548038 | \n",
" ... at Folk enten det nu sker for at gavne Skolen eller skade Læreren , skal foretage Omreguleringer , hvorved Ugetallet... | \n",
"
\n",
" \n",
" 123 | \n",
" URN:NBN:no-nb_digibok_2016112448007 | \n",
" ... I 1878 vart banken flytt til Enge skule der Fosse nå vat blitt lærar , og der heldt den til... | \n",
"
\n",
" \n",
" 316 | \n",
" URN:NBN:no-nb_digibok_2007050804034 | \n",
" ... nan en kort tid virket som la3rer ved verketB skole . ? ler var det ogB2 at nan mottok meldingen... | \n",
"
\n",
" \n",
" 31 | \n",
" URN:NBN:no-nb_digibok_2017120548038 | \n",
" ... Men pliktig medlemskap i Norges Lærersamband var framleis eit vilkår for å kunne halde skule , og det gjekk ikkje... | \n",
"
\n",
" \n",
" 293 | \n",
" URN:NBN:no-nb_digibok_2012091308000 | \n",
" ... lære , og i 1835 startet han en litografisk skole i Stockholm . En annen litograf dro samtidig til Frankrike... | \n",
"
\n",
" \n",
"
\n"
],
"text/plain": [
""
]
},
"execution_count": 9,
"metadata": {},
"output_type": "execute_result"
}
],
"source": [
"dh.Concordance(corpus=korpus, query='skole OR skolen OR Skole OR skule').show()"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Tilbake til [DHLAB ved Nasjonalbiblioteket](https://nbviewer.jupyter.org/github/DH-LAB-NB/DHLAB/blob/master/DHLAB_ved_Nasjonalbiblioteket.ipynb)"
]
}
],
"metadata": {
"kernelspec": {
"display_name": "dhlab",
"language": "python",
"name": "python3"
},
"language_info": {
"codemirror_mode": {
"name": "ipython",
"version": 3
},
"file_extension": ".py",
"mimetype": "text/x-python",
"name": "python",
"nbconvert_exporter": "python",
"pygments_lexer": "ipython3",
"version": "3.10.12"
},
"varInspector": {
"cols": {
"lenName": 16,
"lenType": 16,
"lenVar": 40
},
"kernels_config": {
"python": {
"delete_cmd_postfix": "",
"delete_cmd_prefix": "del ",
"library": "var_list.py",
"varRefreshCmd": "print(var_dic_list())"
},
"r": {
"delete_cmd_postfix": ") ",
"delete_cmd_prefix": "rm(",
"library": "var_list.r",
"varRefreshCmd": "cat(var_dic_list()) "
}
},
"types_to_exclude": [
"module",
"function",
"builtin_function_or_method",
"instance",
"_Feature"
],
"window_display": false
},
"vscode": {
"interpreter": {
"hash": "1d1df0d064732dbd8ae09ceab87be2790d7eed279040ea9405054873f855fb6c"
}
}
},
"nbformat": 4,
"nbformat_minor": 2
}