Paket: r-cran-tokenizers (0.2.1-3)

Länkar för r-cran-tokenizers

Trisquelresurser:

Hämta källkodspaketet r-cran-tokenizers:

Ansvarig:

Debian R Packages Maintainers

Original Maintainers:

Debian R Packages Maintainers
Andreas Tille

Externa resurser:

Hemsida [cran.r-project.org]

Liknande paket:

GNU R fast, consistent tokenization of natural language text

Convert natural language text into tokens. Includes tokenizers for shingled n-grams, skip n-grams, words, word stems, sentences, paragraphs, characters, shingled characters, lines, tweets, Penn Treebank, regular expressions, as well as functions for counting characters, words, and sentences, and a function for splitting longer texts into separate documents, each with the same number of words. The tokenizers have a consistent interface, and the package is built on the 'stringi' and 'Rcpp' packages for fast yet correct tokenization in 'UTF-8'.

Andra paket besläktade med r-cran-tokenizers

beror

rekommenderar

föreslår

dep: libc6 (>= 2.14)

GNU C Library: Shared libraries
också ett virtuellt paket som tillhandahålls av libc6-udeb
dep: libgcc-s1 (>= 3.3.1)

GCC support library
dep: libstdc++6 (>= 11)

GNU Standard C++ Library v3
dep: r-api-4.0

virtuellt paket som tillhandahålls av r-base-core
dep: r-base-core (>= 4.1.1-2)

GNU R core of statistical computation and graphics system
dep: r-cran-rcpp (>= 0.12.3)

GNU R package for Seamless R and C++ Integration
dep: r-cran-snowballc (>= 0.5.1)

Snowball stemmers based on the C libstemmer UTF-8 library
dep: r-cran-stringi (>= 1.0.1)

GNU R character string processing facilities

rec: r-cran-testthat

GNU R testsuite

sug: r-cran-covr

test coverage for GNU R packages
sug: r-cran-knitr

GNU R package for dynamic report generation using Literate Programming
sug: r-cran-rmarkdown

convert R markdown documents into a variety of formats

Hämta r-cran-tokenizers

Hämtningar för alla tillgängliga arkitekturer
Arkitektur	Paketstorlek	Installerad storlek	Filer
amd64	637,6 kbyte	817 kbyte	[filförteckning]

Sections