Ordparadigmer med wordbank

DHlab_logo_web_no_red.png

1.11. Ordparadigmer med wordbank#

wordbank er en pakke i dhlab som lar oss hente ut ordparadigmer.

from dhlab.wordbank.wordbank import WordForm, WordLemma, WordParadigm
from dhlab.ngram.ngram import Ngram
WordParadigm("meter").paradigms
0 1
0 subs [meter, meteren, meterne]
WordForm("meter").forms
0
0 subst mask appell ent ub normert
1 subst mask appell fl ub normert
# Finn lemma
WordLemma("meteren").lemmas
0 1
0 subs meter
# Vi kan også legge dette i en variabel, som vi kan se på

søster = WordParadigm("søster")
søster.paradigms
0 1
0 subs [søster, søstera, søsteren, søstre, søstrene, ...
# Eksempel med ord som er både adjektiv, substantiv og verb

fisker = WordParadigm("fisker")
fisker.paradigms
0 1
0 adj [fiska, fiskede, fiskende, fisket, fiskete]
1 subs [fisk, fisken, fiskene, fisker, fiska, fiske, ...
2 verb [fisk, fiska, fiske, fisker, fiskes, fisket]

1.11.1. N-gram for ordparadigmene#

Her har vi en funksjon som viser ngram for ordene i word_paradigm, paradigme_ngram.

y= definerer hvilken av ordgruppene vi får ut. Default er satt til 0. z= her kan vi angi ord utenfor paradigmet som vi også ønsker å undersøke.

søster.paradigms.loc[0, 1]
['søster', 'søstera', 'søsteren', 'søstre', 'søstrene', 'søstrer']
Ngram(søster.paradigms.loc[0,1], from_year=1840).plot(smooth=5, alpha=0.8, lw=5)
../_images/f1d7a173e2f1cd8d6b96b91e10b8305f50514d91dfc72e869a58b790fb950e8d.png