+1 Daumen
288 Aufrufe

Ich versuche, die besten Möglichkeiten zu verstehen, Text nach ihrer Länge und dem Begriff der verteilten Häufigkeit zu filtern und zu sortieren.

 Find all the four-letter words in the Chat Corpus (text5). With the help of a frequency distribution (FreqDist), show these words in decreasing order of frequency.

Natural Language Processing with Python, ch1 from Steven Bird, Ewan Klein and Edward Loper



Das heißt, finden Sie alle vier Buchstaben Wörter im Chat Corpus (text5). Mit Hilfe einer Häufigkeitsverteilung (FreqDist) zeigen Sie diese Wörter in absteigender Reihenfolge der Häufigkeit an.


Ich habe das Ding ausprobiert. Ich denke, es zeigt es in abnehmender Reihenfolge der Frequenz, aber ich bin mir nicht sicher, ob es der effizienteste Weg ist, soweit ich es in drei Zeilen schreiben muss.

    >>> from nltk.books import *
    >>> aux = sorted(w for w in set(text2) if len(w) == 4)
    >>> aux.reverse()
    >>> aux
    [u'zeal', u'your', u'year', u'yard'...

von

Ein anderes Problem?

Stell deine Frage

Willkommen bei der Stacklounge! Stell deine Frage einfach und kostenlos

x
Made by a lovely community