一个轻量级的自然语言处理(NLP)工具包—fastNLP

一个轻量级的自然语言处理(NLP)工具包—fastNLP

2022-09-01 0 1,214
资源编号 36629 最近更新 2022-09-01
¥ 0人民币 升级VIP
立即下载 注意事项
下载不了?请联系网站客服提交链接错误!
增值服务: 安装指导 环境配置 二次开发 模板修改 源码安装

本期推荐的是一个轻量级的自然语言处理(NLP)工具包——fastNLP。

fastNLP是一款轻量级的自然语言处理(NLP)工具包,目标是快速实现NLP任务以及构建复杂模型。fastNLP 由 core 、 io 、embeddings 、 modules、 models 等子模块组成:

  • core 是fastNLP 的核心模块,包括 DataSet、 Trainer、 Tester 等组件
  • io 是实现输入输出的模块,包括了数据集的读取,模型的存取等功能
  • embeddings 提供用于构建复杂网络模型所需的各种embedding
  • modules 包含了用于搭建神经网络模型的诸多组件,可以帮助用户快速搭建自己所需的网络
  • models 包含了一些使用 fastNLP 实现的完整网络模型,包括 CNNText 、 SeqLabeling 等常见模型

一个轻量级的自然语言处理(NLP)工具包—fastNLP

fastNLP的特性:

一个轻量级的自然语言处理(NLP)工具包—fastNLP

项目结构:

一个轻量级的自然语言处理(NLP)工具包—fastNLP

安装:

fastNLP 依赖如下包:

numpy>=1.14.2torch>=1.0.0tqdm>=4.28.1nltk>=3.4.1requestsspacyprettytable>=0.7.2

简单示例:

使用DataSet预处理文本

  • fastNLP中的DataSet

DataSet 是fastNLP用于承载数据的类,一般训练集、验证集和测试集会被加载为三个单独的 DataSet 对象。

DataSet 中的数据组织形式类似一个表格,比如下面 DataSet 一共有3列,列在fastNLP中被称为field。

一个轻量级的自然语言处理(NLP)工具包—fastNLP

每一行是一个instance (在fastNLP中被称为 Instance ), 每一列是一个field (在fastNLP中称为 FieldArray )。

  • DataSet的构建

初始化一个DataSet

from fastNLP import DataSetdata = {'raw_words':["This is the first instance .", "Second instance .", "Third instance ."],'words': [['this', 'is', 'the', 'first', 'instance', '.'], ['Second', 'instance', '.'], ['Third', 'instance', '.']],'seq_len': [6, 3, 3]}dataset = DataSet(data)# 传入的dict的每个key的value应该为具有相同长度的listprint(dataset)

输出为:

+------------------------------+------------------------------------------------+---------+ |           raw_words                 |                     words                                         | seq_len  |+------------------------------+------------------------------------------------+---------+ | This is the first instance .     | ['this', 'is', 'the', 'first', 'instance', ...                |    6         | |      Second instance .           |          ['Second', 'instance', '.']                         |    3        | |       Third instance .              |           ['Third', 'instance', '.']                           |    3        |+------------------------------+------------------------------------------------+---------+

更多内容请大家自行前往阅读fastNLP 中文文档 — fastNLP 0.6.0 文档

资源下载此资源为免费资源立即下载

申明:本文由第三方发布,内容仅代表作者观点,与本网站无关。对本文以及其中全部或者部分内容的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。本网发布或转载文章出于传递更多信息之目的,并不意味着赞同其观点或证实其描述,也不代表本网对其真实性负责。

七爪网 免费源码 一个轻量级的自然语言处理(NLP)工具包—fastNLP https://www.7claw.com/36629.html

分享免费的开源源码

常见问题
  • 1、自动:拍下后,点击(下载)链接即可下载;2、手动:拍下后,联系卖家发放即可或者联系官方找开发者发货。
查看详情
  • 1、源码默认交易周期:手动发货商品为1-3天,并且用户付款金额将会进入平台担保直到交易完成或者3-7天即可发放,如遇纠纷无限期延长收款金额直至纠纷解决或者退款!;
查看详情
  • 1、七爪会对双方交易的过程及交易商品的快照进行永久存档,以确保交易的真实、有效、安全! 2、七爪无法对如“永久包更新”、“永久技术支持”等类似交易之后的商家承诺做担保,请买家自行鉴别; 3、在源码同时有网站演示与图片演示,且站演与图演不一致时,默认按图演作为纠纷评判依据(特别声明或有商定除外); 4、在没有”无任何正当退款依据”的前提下,商品写有”一旦售出,概不支持退款”等类似的声明,视为无效声明; 5、在未拍下前,双方在QQ上所商定的交易内容,亦可成为纠纷评判依据(商定与描述冲突时,商定为准); 6、因聊天记录可作为纠纷评判依据,故双方联系时,只与对方在七爪上所留的QQ、手机号沟通,以防对方不承认自我承诺。 7、虽然交易产生纠纷的几率很小,但一定要保留如聊天记录、手机短信等这样的重要信息,以防产生纠纷时便于七爪介入快速处理。
查看详情
  • 1、七爪作为第三方中介平台,依据交易合同(商品描述、交易前商定的内容)来保障交易的安全及买卖双方的权益; 2、非平台线上交易的项目,出现任何后果均与互站无关;无论卖家以何理由要求线下交易的,请联系管理举报。
查看详情

相关文章

发表评论
暂无评论
官方客服团队

为您解决烦忧 - 24小时在线 专业服务