AI python nltk | nltk . token ize . lineokenizer

python nltk | nltk . token ize . lineokenizer

原文:https://www . geesforgeks . org/python-nltk-nltk-token ize-line token izer/

借助**nltk.tokenize.LineTokenizer()**方法，我们能够使用tokenize.LineTokenizer()方法从单行形式的句子串中提取标记。

语法: tokenize.LineTokenizer() 返回:从句子流中返回行的标记。

示例#1 : 在这个示例中，我们可以看到，通过使用tokenize.LineTokenizer()方法，我们能够将句子流中的标记提取为小行。

# import LineTokenizer() method from nltk
from nltk.tokenize import LineTokenizer

# Create a reference variable for Class LineTokenizer
tk = LineTokenizer()

# Create a string input
gfg = "GeeksforGeeks...$&* \nis\n for geeks"

# Use tokenize method
geek = tk.tokenize(gfg)

print(geek)

输出:

[“极客”…$ & *‘是’，‘代表极客’]

例 2 :

# import LineTokenizer() method from nltk
from nltk.tokenize import LineTokenizer

# Create a reference variable for Class LineTokenizer
tk = LineTokenizer(blanklines ='keep')

# Create a string input
gfg = "The price\n\n of burger \nin BurgerKing is Rs.36.\n"

# Use tokenize method
geek = tk.tokenize(gfg)

print(geek)

输出:

[“汉堡的价格”是 36 卢比]

版权属于：月萌API www.moonapi.com，转载请注明出处

本文链接：https://moonapi.com/news/13105.html

AI 查看更多书籍

《GeeksForGeeks 人工智能中文教程 2022-06-21》

分类

最近更新

AI python nltk | nltk . token ize . lineokenizer

python nltk | nltk . token ize . lineokenizer

留言

联系客服

数据知识

系统公告

开发文档

AI查看更多书籍

《GeeksForGeeks 人工智能中文教程 2022-06-21》

AI python nltk | nltk . token ize . lineokenizer

python nltk | nltk . token ize . lineokenizer

留言

联系客服

AI 查看更多书籍