Ordparadigmer med wordbank

DHlab_logo_web_no_red.png

1.11. Ordparadigmer med wordbank#

wordbank er en pakke i dhlab som lar oss hente ut ordparadigmer.

from dhlab.wordbank.wordbank import WordForm, WordLemma, WordParadigm
from dhlab.ngram.ngram import Ngram
WordParadigm("meter").paradigms
0 1
0 subs [meter, meteren, meterne]
WordForm("meter").forms
0
0 subst mask appell ent ub normert
1 subst mask appell fl ub normert
# Finn lemma
WordLemma("meteren").lemmas
0 1
0 subs meter
# Vi kan også legge dette i en variabel, som vi kan se på

søster = WordParadigm("søster")
søster.paradigms
0 1
0 subs [søster, søstera, søsteren, søstre, søstrene, ...
# Eksempel med ord som er både adjektiv, substantiv og verb

fisker = WordParadigm("fisker")
fisker.paradigms
0 1
0 adj [fiska, fiskede, fiskende, fisket, fiskete]
1 subs [fisk, fisken, fiskene, fisker, fiska, fiske, ...
2 verb [fisk, fiska, fiske, fisker, fiskes, fisket]

1.11.1. N-gram for ordparadigmene#

Her har vi en funksjon som viser ngram for ordene i word_paradigm, paradigme_ngram.

y= definerer hvilken av ordgruppene vi får ut. Default er satt til 0. z= her kan vi angi ord utenfor paradigmet som vi også ønsker å undersøke.

søster.paradigms.loc[0, 1]
['søster', 'søstera', 'søsteren', 'søstre', 'søstrene', 'søstrer']
Ngram(søster.paradigms.loc[0,1], from_year=1840).plot(smooth=5, alpha=0.8, lw=5)
../_images/0a1b6cf2b0ad217326e02963e3e822108564d71c7ee61af6adc8127527563266.png