术致科技

您现在的位置是:首页 > 字体 > 字体百科 > 正文

字体百科

大小写转换器在线转换_我在找能开发一些单位的小应用的工具

爱字体2023-07-06字体百科0
本文目录大小写转换器在线转换,我在找能开发一些单位的小应用的工具?金额大写转换器?有哪些技巧可以提高PPT的制作速度?大家编程都用什么编辑器?有没有运用机器学习处理文本分类问题的教程?大小写转换器在线
本文目录

大小写转换器在线转换,我在找能开发一些单位的小应用的工具?

在我认识的所有程序员里,每个人几乎都有专属于自己的常用工具和相关资源,今天给大家奉上数十个程序员硬核工具,我相信这里总有一款工具是属于你的!

大小写转换器在线转换_我在找能开发一些单位的小应用的工具

程序员生产力工具大全如下:

1. Idea-Intellij IDEA (java 编程语言 开发的集成环境)

业界排名第一的java开发工具,非常非常好用,如果还在用eclipse的朋友,赶紧来体验一把,你一定会爱上她的。

2. SecureCRT (SSH终端仿真程序)

SecureCRT是一款终端仿真程序,支持SSH(SSH1和SSH2)以及Telnet和rlogin协议。SecureCRT用于连接运行包括Windows、UNIX和VMS在内的远程系统的理想工具。

3. Termius (全平台的远程终端)

termius是一款全平台的远程终端,Termius不仅涵盖了Windows、Linux、OSX,还变态得支持Android和iOS(以后在地铁、公交上都可以随时拿出手机来排查线上问题啦,还真是广大程序员的福音呢。

4. Google Chrome (谷歌浏览器)

Google Chrome是一款由Google公司开发的网页浏览器,该浏览器基于其他开源软件撰写,包括WebKit,目标是提升稳定性、速度和安全性,并创造出简单且有效率的使用者界面。

5. iTerm (为Mac OS X编写的终端仿真程序)

iTerm是一个为Mac OS X编写的,功能齐全的终端仿真程序;目标是在为用户提供OS X下最佳的命令行体验;字母i代表了本地苹果的外观和风格的程序界面,并把重点放在完整的国际支持; 它合并由两个项目, CTerminal和TerminalX ,而这两者都是基于JTerminal项目;该软件非常有实用和易用性。

6. Visual Studio Code (简称“VS Code”,编写现代Web和云应用的跨平台源代码编辑器)

重新定义和优化了代码编辑,以便生成和调试新式 Web 应用程序和云应用程序。也是著名的文本编辑器,它是轻量级的,vSCode的一大特点就是你可以通过多种方式来调整设置,而且Vim可以和VScode集成在一起,它还带有一个集成终端,可用的扩展太多,使开发人员的工作变得更加轻松。我最喜欢的一些扩展是AWS Toolkit, ESLint,Live Server, Live Share, Prettier-代码格式化程序,YAML,Live Sass编译器,Docker等。

7. VMware Fusion & VMware workstation (为计算机开发的虚拟机管理程序)

是在计算机上无缝运行 Windows 的最佳方式,可确保 Windows 应用程序在计算机上实现无缝运行可以在基于 Intel 的计算机上无缝运行 Windows、Linux 以及其他 PC等多个操作系统,进而构建、测试或演示软件。

8. Navicat Premium (数据库管理工具)

Navicat premium是一款数据库管理工具,是一个可多重连线资料库的管理工具,它可以让你以单一程式同时连线到 MySQL、SQLite、Oracle 及 PostgreSQL 资料库,让管理不同类型的资料库更加的方便。

9. Postman (api调试工具)

简单来说,四个词,简单、实用、大方、美观!postman这款网页调试工具的windows客户端,功能强大的HTTP调试与模拟插件。使用Postman可以进行API开发、请求、调试,除了它,还可以使用lnsomnia和Insomnia Designer作为API文档。

10. RedisDesktopManager (一款可视化 redis管理工具 )

Redis Desktop Manager是一款简单快速、跨平台的Redis桌面管理工具,也被称作Redis可视化工具,Redis Desktop Manager官方版是一款开源软件,支持通过SSH Tunnel连接,支持windows、mac等多平台。

11. Dash (基于MAC的 API文档浏览器和代码片段管理器)

“开发者不可或缺的杰作。”Dash 可让您的 Mac 即时离线访问 200 多个 API 文档集。立刻搜索离线文件集200层+的API ,100+备忘单和 href="">更多 功能。您甚至可以"">生成自己的文档集 或 href="">请求 包含href="">文档集 。

12. Fiddler & Wireshark (http抓包工具)

Fiddler和Wireshark都是进行抓包的工具:所谓抓包就是将网络传输发送与接收的数据包进行截获、重发、编辑、转存等操作,也用来检查网络安全。作为开发者,经常想调试一下http请求发送的数据的详情,那么可以使用这2款软件。用抓包工具wireshark的人相对来说更多一些。

13. HBuilder X (HTML5的Web开发工具)

当前最快的HTML开发工具,强大的代码助手帮你快速完成开发,最全的语法库和浏览器兼容性数据让浏览器碎片化不再头痛。作为HBuilder下一代的全新编辑器,HBuilderX被定位为ide和编辑器的完美结合,除了对某种语言的语法分析、提示、转到定义、调试,同时加强了对通用文本处理能力,界面更加清爽,拥有比上一代更加有效的快捷键体系。

14. MobaXterm (远程终端控制软件,集串口,SSH远程登录和FTP传输三合一的工具)

多功能终端MobaXterm Professional Edition 是一款豪华、全功能的终端软件。MobaXterm带来了所有必要的Unix命令到Windows桌面,在开箱单便携式exe文件。MobaXterm允许您启动远程会话。远程shell,MobaXterm远比Putty好用,您可以选择创建SSH,远程登录,Rlogin,RDP,VNC,XDMCP,FTP,SFTP或串行会话。

15. Sublime Text (跨平台代码编辑器)

http://www.sublimetext.cn/

Sublime Text 是一款用于代码、标记和散文的精致文本编辑器。Sublime Text 中文网致力于为广大国内开发者提供详尽的中文文档、使用说明等,助力开发者快速掌握这个编辑器。

16.webstorm (专业的HTML编辑工具)

web开发的必备的一款开发神器,比如写js、页面、css,那么这款软件用起来非常顺手。此软件和idea出自于同一家公司,这家公司做了很多异常好用的软件,基本上你需要的各种开发相关的IDE,这家公司都生产。可以说是“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”。新版对JavaScript,TypeScript和CSS支持更好,改进了Vue.js的体验,并为Jest集成增加了新功能。

17.Xshell (功能强大的终端模拟器)

linux原创控制软件,完全免费且非常稳定的 SSH 客户端 ,支持多种远程协议,提供了很多特色与高级功能,简体中文界面也让你轻松管理远程服务器。 Xshell 的 Screen 会话不闪屏,而且可以回滚;Script 的执行顺序可以调整;可以同时发送指令到多个 session;支持布局切换等。

18. SwitchHosts (修改Hosts文件的工具)

这是用于在多个HOSTS之间进行切换。可在公用hosts文件 、当前系统hosts、本地方案和在线方案间进行切换。作为一名开发人员,经常需要修改本地host,你还是通过修改host文件来操作的么?那样太慢了,这里建议大家使用switchhosts这款软件,可以快速修改本地host,非常好用。

其他工具:

1. CodeIf(智能命名) : https://unbug.github.io/codelf

大部分开发者都或多或少遇到过变量命名的烦恼,如果命名不规范,不仅会影响开发的效率,而且对后面维护的同学来说也是一个不小的挑战,因为他要去揣摩你这个变量的含义。随着项目越来越复杂,变量和函数数量越来越多,虽然每个编程语言都有各种命名规范,但是也不能解决所有的问题。

“计算机科学里两件最难的事:缓存失效和命名。” Codelf通过搜索在线开源平台Github, Bitbucket, Google Code, Codeplex, Sourceforge, Fedora Project的项目源码,帮开发者从中找出已有的匹配关键字的变量名,从而帮助为变量名苦恼的开发者命名。这个搜索服务支持直接搜索中文。

同时可以在自己用的编辑器里安装插件,支持 VS Code、Atom、Sublime Text 和 Chrome。

2. DocsChina-印记中文 : https://www.docschina.org

这是一个前端中文文档合集,进入网站可以看到开发中经常使用的前端中文文档。如果你的英文实在不怎么好,还在为找中文文档而烦恼,这里将是你非常好的选择。记得放到自己的浏览器收藏夹里哦!

3. any-rule(正则表达大全): http://github.com/any86/any-rule

any-rule 维护了一个常用正则表达式合集,并且本身是一个支持 Web/VS Code/idea/Alfred Workflow 多平台的正则表达式工具。

4. tool.lu(在线工具): https://tool.lu

程序员总是有很多小工具要使用,比如图片、Base64编码、Markdown编辑器时间戳转换,进制转换等,在线运行各种语言代码。这个网站包含了太多程序员需要用到的小工具了。比如你想运行点JAVA代码,又不想麻烦的在系统中安装JAVA环境,可以使用里边的在线运行代码工具,然后选择JAVA,写点JAVA代码就可以直接运行了。

5. Baomitu(前端静态源库): https://cdn.baomitu.com

这个静态资源库是支持HTTP/2的CDN服务,有了它,如果你是自己的小型项目或者是做测试就不用下载任何的代码库,直接粘贴地址过来用就可以,因为是国内的CDN库,速度还非常的快。

6. Typora-Markdown(编写工具):https://www.typora.io

一款实用的 Markdown 编写工具,所见即所得,用Markdown编写文章是一个程序员的标准配置,也就是标配。现在有很多在线工具都支持Markdown,什么有道云笔记、雀语,、印象笔记等。这种简单的界面,沉浸式的编写,清晰的大纲,它就像一件称手的兵器,让你一旦拥有就爱不释手。

7. Snipaste (简单便捷的截图软件):https://zh.snipaste.com/download.html

一款免费的桌面截图软件,功能强大,使用方便,支持任何屏幕位置截图,支持窗口截图,支持快捷方式截图。您可通过截取贴图,使两张图合并为一张图,还能调整截图文字图像等等,是一款非常强大的贴图软件,喜欢此款贴图软件的朋友不要错过。

8. Captura (最好用的开源录屏、gif动态图片制作工具)

官网:https://captura.updatestar.com/github:https://github.com/MathewSachin/Captura

通过这款工具可以帮助你轻松录制各种视频。支持全屏录制、区域录制两种方式,全屏录制可以录制全部的电脑屏幕,将电脑屏幕上所有的动态都录制下来,该软件还拥有视频编解码器,可以对视频进行解码,支持mp4、avi、GIF、webm等格式,可以满足一般的解码需要。还支持屏幕截图、剪贴板,简单的图像编辑等功能,是一款非常好用的屏幕录像工具。

9. 向日葵 (远程控制软件): https://sunlogin.oray.com/

向日葵远程控制是一款提供远程控制服务的软件。向日葵远程控制支持主流操作系统Windows、Linux、Mac、Android、iOS跨平台协同操作,在任何可连入互联网的地点,都可以轻松访问和控制安装了向日葵远程控制客户端的设备。整个远控过程,可通过浏览器直接进行,无需再安装软件。

10. Everything (本地文件检索工具):http://www.voidtools.com/support/everything/

由voidef="">tools 开发的一款文件搜索工具,这款软件是基于名称实时定位文件和目录。Everthing功能强大,体积小巧,第一次安装使用时会建立一个索引数据库,将所有文件和文件夹的名称导入其中,后续使用能够以极快的速度快速搜索,查找到你所需要的文件。

11. StarUML (UML画图工具)

画uml图的一款神器,类图、时序图、流程图、状态图等等,都可以用这款工具轻松应对。

12. uTools (生产力工具集):https://u.tools/

一个极简、插件化、跨平台的现代化桌面软件。通过自由选配丰富的插件,打造你得心应手的工具集合。这个工具,我只能说他是一款神奇,太牛逼,这款工具中汇集了很多好用的工具,可以通过这款工具秒开电脑上的各种软件。

搜索资源网站工具:

1.Bing

Bing 国际版:https://cn.bing.com/感觉比某度要好用多了。

2.DuckDuckGo

DuckDuckGo:https://duckduckgo.com/从官网的介绍来看这个搜索引擎不收集用户信息,而且没有广告。

3.Stack Overflow

Stack Overflow:https://stackoverflow.com/我们如果常用 Google,很多技术问题的答案就在这个网站上,如果你无法使用 Google 可以在这个网站上直接检索就好了。

4.Gitlogs

Gitlogs:https://www.gitlogs.com/Gitlogs 是专门针对 GitHub 项目的搜索引擎,我们通过他可以快速找到想要项目。

5.jiumo search

文档搜索引擎 jiumo search 鸠摩搜书:https://www.jiumodiary.com/可以用来找一些技术文档手册,很多在百度网盘里。

6.Ebooke

Ebooke:https://ebookee.org/Ebookee 是一个基于互联网并提供免费电子图书下载的搜索引擎网站。

7.Iconfinder

图标搜索:https://www.iconfinder.com/用来查找 logo 图片。

8.TinEye

TinEye:https://www.tineye.com用图片来检索图片,我们可以上传图片或输入图片的 URL 来检索。

9.SemanticScholar

SemanticScholar:https://www.semanticscholar.org/SemanticScholar 是一个免费学术搜索引擎,其检索结果来自于期刊、学术会议资料或者是学术机构的文献。

10.LibreStock

LibreStock:https://librestock.com/LibreStock 上可以检索一些优质的高清图片。

http://11.CC Search

CC Search:https://ccsearch.creativecommons.org/CC Search 上搜索到的图片资源都是无版权的,我们可以免费的使用。

12.Pexels

Pexels:https://www.pexels.com/高质量的图片网站,可以免费使用。

13.Unsplash

Unsplash:https://unsplash.com/免费高清素材网站。

14.The App Store

The App Store:https://theappstore.org/The App Store 是一个针对苹果手机、iPad、Mac 设备的应用搜索工具。

在线画图工具:

• 在线画图工具ProcessOn:https://www.processon.com/• 在线画图工具http://draw.io:https://app.diagrams.net/• 在线思维导图工具:http://www.mindline.cn/webapp• PlantUML在线编辑器:http://haha98k.com/

在线开发辅助工具:

日常开发经常会用到一些辅助工具我总结为8大类,包括:编解码工具、转换工具、正则工具、编译工具、网络工具、格式化工具、可视化工具、在线生成器、以及其他工具等等。具体列表如下:

在线编码工具:

BASE64编解码工具:https://base64.supfree.net/• MD5编码工具:https://www.zxgj.cn/g/md5• AES/DES加解密:http://www.fly63.com/tool/cipher/• JWT解码工具:http://jwt.calebb.net/• ASCII编解码工具:https://www.matools.com/code-convert-ascii• Unicode编解码工具:https://www.zxgj.cn/g/unicode• UTF-8编解码工具:https://www.zxgj.cn/g/utf8• 字符串编解码工具:https://www.zxgj.cn/g/enstring• URL编解码工具:http://tool.chinaz.com/tools/urlencode.aspx?jdfwkey=lbixz1

在线转换工具:

在线ASCII码对照表:http://www.fly63.com/tool/ascii/• 通用进制转换工具:https://www.zxgj.cn/g/jinzhi• 在线浮点数十进制转换:http://www.binaryconvert.com/• RGB颜色转换:https://www.zxgj.cn/g/yansezhi• 时间戳转换工具:https://www.zxgj.cn/g/unix• 计量单位换算工具:http://www.fly63.com/tool/unitable/• 在线JSON解析:http://www.json.cn/• 在线JS代码格式化工具:https://prettier.io/playground/• SQL压缩/格式化工具:https://www.zxgj.cn/g/sqlformat• JSON和XML在线转换:https://www.zxgj.cn/g/jsonxml• JSON/YAML在线转换:http://www.fly63.com/tool/jsonyaml/• 人民币大小写转换工具:http://www.fly63.com/tool/renmingbi/

正则表达式工具:

正则表达式调试工具:https://regexr.com/• 正则表达式可视化工具:https://jex.im/regulex/

网络工具:

IP地址归属地查询:https://www.ip138.com/• IP地址查询:https://www.ipip.net/ip.html• HTTP在线接口测试工具:http://www.fly63.com/php/http/

在线编译运行工具:

C#在线编译运行:https://rextester.com/• C/C++在线编译调试:https://www.onlinegdb.com/• 在线编译工具套装:https://c.runoob.com/

可视化/格式化工具:

在线前端编辑器: https://codepen.io/• 在线数据可视化:https://flourish.studio/• 在线JSON解析:http://www.json.cn/• 在线CSS代码可视化工具:https://enjoycss.com/• XML格式化工具:https://www.zxgj.cn/g/xmlformat• 在线JS代码格式化工具:https://prettier.io/playground/• SQL压缩/格式化工具:https://www.zxgj.cn/g/sqlformat• JSON和XML在线转换:https://www.zxgj.cn/g/jsonxml• JSON/YAML在线转换:http://www.fly63.com/tool/jsonyaml/

在线生成器:

UUID在线生成器:https://www.zxgj.cn/g/uuid• 随机数生成器:https://www.zxgj.cn/g/suijishu

其他常用工具:

在线Nginx配置工具:https://nginxconfig.io/• 在线对比工具:http://www.fly63.com/tool/textdiff/• 在线Chrome浏览器插件:https://www.crx4chrome.com/• 在线接口文档管理工具:http://www.docway.net/

在线素材工具:

如果你写文章,或者做视频,那就一定少不了要找素材,包括各种图片、背景、emoji表情、表情包、壁纸、视频、gif图等等。• 免费透明背景图片素材:http://pngimg.com/• Emoji表情搜索:https://emoji.svend.cc/• Emoji表情包下载:https://emojiisland.com/• open source icons:https://feathericons.com/• 表情包在线网站:https://fabiaoqing.com/• 免费PNG图片库:https://pluspng.com/• ICON图标在线下载:https://www.iconfinder.com/• 极简壁纸:https://bz.zzzmh.cn/• Wallpaper Abyss壁纸:https://wall.alphacoders.com• Pixabay图片素材库:https://pixabay.com/zh/• Unsplash图片素材库:https://unsplash.com• Pexels图片素材库:http://www.pexels.com• NASA图片视频素材库:https://images.nasa.gov

设计制作类工具:

对于那些文章创作者和视频创作者而言,设计封面,做海报,设计LOGO,图片美化等等基本也是刚需。

这样大概率日常会用到一些简易好上手的在线设计制作类工具,比如在线P图、音/视频轻量化剪辑、logo制作、海报设计制作、图片美化、在线图片转换或生成等等。• 在线PS:https://www.uupoop.com/• 在线音频剪辑:https://www.weixinsyt.com/• 在线视频剪辑:https://www.kapwing.com/• 免费logo在线制作:http://www.uugai.com/• 艺术字体在线生成:https://www.qt86.com/• 在线表格转换工具: https://tableconvert.com/• 在线海报设计工具: https://www.designcap.com/• 图片智能放大工具:https://bigjpg.com/• 二维码美化器:https://mh.cli.im/• 在线代码截图工具:https://carbon.now.sh/• 在线抠图工具:https://www.remove.bg/zh• ICO图标在线生成:http://www.fly63.com/php/ico/• SVG转PNG工具:http://www.fly63.com/tool/svg2img/• 视频转GIF工具:http://www.fly63.com/tool/giftxt/• 二维码在线生成器:http://www.fly63.com/tool/ewm/• 二维码在线解码:http://www.fly63.com/php/decoder/

写辅助工具:

写文章的过程中经常会用到和写作相关的辅助工具,比方说:字数统计工具、Markdown格式的文章排版工具、图床网站、代码截图工具等等,所以下面这些在线工具就能很好地满足我的需求。• 在线字数统计:https://www.eteste.com/• mdnice markdown排版工具:https://mdnice.com/• md2all markdown排版工具:http://md.aclickall.com/• 在线图床神器:https://picx.xpoet.cn/• 在线免费图床:https://sm.ms/• 图壳图床:https://imgkr.com/• 在线代码截图工具:https://carbon.now.sh/• 在线短链接工具:https://urlify.cn/• 在线文本替换:http://www.fly63.com/tool/textreplace/

在线办公工具:

部分在线工具主要用来处理一些和文档以及文稿相关的事情,经常用到的比如:在线的全套pdf处理和转换工具、各种各样多媒体文件间的相互转换工具、在线识别工具、在线压缩工具等等。• pdf在线处理工具1:https://smallpdf.com/cn/pdf-tools• pdf在线处理工具2:https://tools.pdf24.org/zh/• pdf转word在线工具:https://www.pdftoword.com/• 在线多媒体转换器合集:https://cn.office-converter.com/• 在线文字识别工具:https://ocr.wdku.net/• 在线文件压缩工具:https://docsmall.com/

文档笔记工具:

好记性不如烂笔头,作为一个学习者,我觉得记笔记是必不可少的步骤。当然现在基本都做电子笔记和电子文档比较多。现如今各式各样优秀的文档工具和笔记软件鳞次栉比,好用的也有很多,整理成如下列表,这东西各有长处,使用哪个最合意还得看个人习惯和需求了。• 印象笔记:https://www.yinxiang.com/• 有道笔记:https://note.youdao.com/• OneNote:https://www.onenote.com/• 幕布:https://mubu.com/• 为知笔记:https://www.wiz.cn/• 石墨文档:https://shimo.im/• Simplenote:https://simplenote.com/• 语雀:https://www.yuque.com/

编程学习网:

• 哔哩哔哩:https://www.bilibili.com/• C语言网:https://www.dotcpp.com/• cppreference:http://zh.cppreference.com/• 中国大学MOOC:https://www.icourse163.org/• 牛客网:http://www.nowcoder.com• 网易公开课:http://open.163.com• CodeGym:https://codegym.cc/• BeginnersBook:https://beginnersbook.com/• JavaSED:http://www.javased.com/• codecademy:https://www.codecademy.com/• Coursera:https://www.coursera.org/• StackOverFlow:https://stackoverflow.com/• LeetCode:https://leetcode-cn.com/• LintCode:https://www.lintcode.com/

在线教程文档:

这部分主要集中了在做开发过程中随手参考所要用到的几乎所有在线教程和官方文档,有中文版文档的基本都优先列出来了,但更多时候是英文的官方文档。• Git中文教程:https://git-scm.com/book/zh/v2• SVN中文手册:http://svnbook.red-bean.com/nightly/zh/index.html• jQuery API中文文档:https://jquery.cuishifeng.cn/• Nginx中文文档:https://www.nginx.cn/doc/index.html• Kafka中文文档:https://kafka.apachecn.org/• Mybatis中文文档:https://mybatis.org/mybatis-3/zh/index.html• 微信小程序官方文档:https://developers.weixin.qq.com/miniprogram/dev/framework/• Nodejs中文教程文档:http://nodejs.cn/learn• Apache Web Server文档:http://httpd.apache.org/docs/• Spring文档中文版:https://www.springcloud.cc/spring-reference.html• Golang标准库文档中文版:https://studygolang.com/pkgdoc• Java 8官方文档:https://docs.oracle.com/javase/8/docs/api/index.html• Maven官方文档:http://maven.apache.org/guides/• Tomcat 8官方文档:http://tomcat.apache.org/tomcat-8.0-doc/index.html• Spring Boot官方文档:https://docs.spring.io/spring-boot/docs/current/reference/htmlsingle/• RabbitMQ官方文档:https://www.rabbitmq.com/documentation.html• RocketMQ官方文档:http://rocketmq.apache.org/docs/quick-start/• Dubbo中文文档:https://dubbo.apache.org/zh/docs/• Netty官方文档:https://netty.io/wiki/index.html• Elasticsearch官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html• Spring Cloud官方文档:https://spring.io/projects/spring-cloud• Docker官方文档:https://docs.docker.com/get-started/• kubernetes中文文档:https://kubernetes.io/zh/docs/home/• thymeleaf官方文档:https://www.thymeleaf.org/documentation.html• Vue.js中文文档:https://cn.vuejs.org/v2/guide/• React.js官方文档:https://reactjs.org/docs/getting-started.html• Jenkins中文文档:https://www.jenkins.io/zh/doc/

华为云平台:

高效易用的低代码aPaaS平台-应用魔方AppCube:https://www.huaweicloud.com/product/appcube.html集华为研发实践、前沿研发理念、先进研发工具为一体的软件开发平台-软件开发平台 DevCloud:https://www.huaweicloud.com/devcloud/

以上内容分享自华为云社区《吐血整理:程序员都在用什么工具?》,作者: 考过IE励志当攻城狮 ,部分内容整理自互联网~

金额大写转换器?

数字转换大写工具使用说明:

将阿拉伯数字复制粘贴或输入到“输入小写数字金额”中,比如(123456),然后单击“转换为大写金额”按钮。就会在“显示中文大写金额”框中显示自动转换完成的中文大写内容。最后复制转换完成的内容到想到的地方粘贴即可。

人民币符号:¥;美元符号:$;欧元符号:€;英镑符号:£(货币符号可直接鼠标选中后复制使用)。

有哪些技巧可以提高PPT的制作速度?

不论是学生还是职场,经常用到PPT,对于大多数人来说PPT是一件头疼的事情,因为太费时费力了。更可怕的是有时对PPT越用心制作,页面看起来越有违和感。

希望下面几个技巧和工具可以帮到你。

1. 结论先行,瞟字诀

商务PPT每一页基本可以分为3类信息:导航栏/标题、论点、论证 。为了让受众更好的接收信息,建议将结论前置,同时将重点内容突出,瞟一下就知道大体内容了。

2. 梳理思路

当你意识到PPT需要有结构,哪怕单个页面也是结论先行的时候,你应该明白了PPT之前梳理思路可以极大的节省时间。传统思维导图虽然在整理思路上很有帮助,但是依然不够极致。

工具1:幕布

幕布也可以转化成思维导图形式的放射性树状图,同时,在书写体验上非常的棒,基本上可以让你忽略软件的操作只是在书写文字而已,这种流畅的体验难以语言描述,建议你体验一下会喜欢上它的。

3. 整齐统一

整齐的内容给人一致性的美感,常用的对齐方式有3种:

工具 1 :对齐的快速方法就是选中对象之后,在开始工具栏找到排列,进而选择对齐方式。

工具 2 :另一个很实用却被多数人忽略的就是参考线。制作之前可以设置设置多条参考线,标题栏的位置,页边距的位置等,这样就有一个全局的把握了。同时,对于一些情况使用对齐按钮依然是对不齐的,参考线又派上用场了。

工具 3 :虽然工具1的对齐方式比手动对齐方便,但是还算有些繁琐,建议可以安装美化大师插件,当你选中几个对象之后,页面会自动显示对齐方式,0步骤操作。

4.文字注意事项

字体

中文字体形态各异,不能简单的按照衬线体或非衬线体来区分。这里粗略按照:黑体/圆体、宋体/楷体、书法体/手写体、卡通字体来划分。

黑体和圆体形态比较统一,没有大的变化适合绝大多数场合;

Windows系统默认的宋体并不适合制作PPT,美观度不够,显示效果也比较差,但是这不意味着宋体类字体都不适合出现在PPT中,思源宋体,方正风雅宋都非常优秀。宋体类字体可以适当作为标题或者大字出现,提升PPT的文艺或文化特质;

书法字体适合体现气势,适合在封面出现;

以上是推荐的几种字体,如果你想发现更多好字体,可以下载“字体管家”或者“字由”。当然字体有版权,如果商用请购买版权。

行距与字体颜色

确认字体之后,可以调整行距,正文一般建议行距为1.2-1.5之间,让页面有呼吸感。

字体颜色常用的是黑色,其实你只需要简单将黑色调淡一些(建议15%-25%),就会让页面气质好很多。

5. 使用成熟的配色

千万不要使用PPT默认的配色方案,系统自带的颜色是高饱和度的,给人一种廉价感。感受下图片左边的颜色,很多时候之所以你的PPT看起来低端往往就是不会运用颜色导致的。

右边是经济学人杂志的配色是不是感觉高端很多。

颜色的理论说起来有些复杂,网上很多虽然说了却又只是点到为止。这里最方便的是建议参考优秀的案例,复制一模一样的配色方案。

参考网站 1 :http://www.bootcss.com/p/flat-ui/

扁平风格配色基本都使用这里的颜色。

参考网站 2 :https://www.materialpalette.com/teal/teal

这是谷歌标准的配色方案。

当你在左侧选中了主色之后,右下角会自动匹配出建议的配色,非常的人性化。

如果觉得这里的配色还不够细化,可以点击顶部的color按钮,进入色卡页面,点击任意色卡都会看到14个等分的颜色。见下图左侧。因为是等分的颜色,搭配起来应该容易多啦。

网站参考 3 :http://www.colorhunt.co/

这个网站收集了很多优质的配色方案,都非常漂亮。

参考网站 4 :http://zhongguose.com/#yinzhu

这个是中国风的颜色网址,如果做中国风的PPT一定不要忘记它。

就推荐以上4个网站的配色方案啦,这些都是经过专业调解过的颜色。

工具 1 :取色器

从其他地方取色最方便的工具就是取色器啦。选中对象之后点击鼠标右键,点击颜色选项之后再点击取色器,这时候鼠标就变成了取色器的形状,便可以在PPT页面内取色了。(如果想从PPT外取色,这时候只要长按鼠标左键就可以)

工具 2 :设计你的主题色

工具1只是单个对象修改颜色,如果想让PPT整体统一使用目标颜色,就需要修改主题色了。

选择设计-变体-颜色-自定义颜色就可以修改主题色了。

当你改好之后,你会发现,再插入图表,表格等的时候,颜色全部都统一了。是不是方便。

6. 图片的技巧

你一定听过并认同“一图胜千言”类似的话,但是遇到的问题却是到哪里找到优秀的图片。

推荐几个高质量图片网站

500x:数量和质量都非常高的收费网站;

pixabay:免费可商用图片,支持中文搜索;

pexels:免费可商用图片,英文搜索,图库更多;

librestock:43家图片网站聚合搜索网站;

pngimg:免抠图图片网站,即背景是透明的;

图片管理插件:方片

看到好看的图片就要下载下来,然后归类整理,这件事情很麻烦,而且很消耗存储空间,更重要的一点,图片多了就不好查找了。

不过没关系,方片帮你搞定。你需要将图片下载下来,只需要在使用的时候快速找到它们,下载使用就OK了。

方片收藏图片非常方便,看到好图,鼠标拖动一下就可以收藏起来了,支持图片分类管理,支持一键批量下载。感受一下:

图片下载:图片助手

看到好图就会右键另存为下载,其实方片可以拖动一下就下载更方便。

不过,有些时候在网上看到一个很喜欢的图片,可是右键另存为就是找不到下载按钮怎么办,这是网站做了图片保护的设置,这个时候可以借助下载插件,如图片助手,image download等。以图片助手为例,点击鼠标右键,选择图片助手,网上图片大爆炸似的炸开了,就可以下载了。

7. 设置视觉引导符

不论是从美观度还是信息接收的角度,视觉引导符是很有必要的,相当一部分人没有引导符这个概念,当然当你有了之后,会看到不一样的东西。

上页模拟了2个PPT页面,是不是觉得很低端,右侧在标题处使用了色块相对好一些。

标题的地方增加了横线或者竖线是不是感觉好多了,这就是引导符的作用。当然长长的横线还起到了平衡的效果。

8. 使用好看的图标

图标除了前文说的做引导符的作用,还可以取代图片做内容的解释作用。

阿里巴巴图标库:http://www.iconfont.cn/

数量种类都非常多,效果也非常棒。

Flaticon:http://www.flaticon.com/

这个网站的图标不仅适合做小图标,也可以做大图,非常推荐。

工具:Icons8

Icons8 可以筛选风格,更改图标颜色,而且插入PPT中的方法非常方便,点击图标拖动鼠标就拖到PPT里面了,这是icons8最方便的地方啦。

9. 关于PPT的保存

其实PPT制作完成之后可以保存成很多形式,比如PDF,MP4,图片等。方法就是点击文件-另存为,然后点击保存类型,就可以选择格式了。

10. PPT的压缩

很多公司对邮件大小有限制,PPT的压缩很有必要,其实不需要各种压缩软件,PPT自带的就有啦。在上图保存PPT的时候,选择工具,就会看到压缩图片的按钮了,点击之后会要求你选择保存图片的质量。选择合适的大小就OK拉。同时勾选删除图片的剪裁区域。

11. 推荐1个PPT插件:美化大师

在PPT排版对齐的部分已经推荐过这个插件了,因为确实非常好用,而且是免费的。它还有很多实用功能。

功能1:收藏

如果你喜欢某个PPT的页面,排版也好,配色也好,都可以一键收藏到云端,下次制作PPT的时候可以插入到PPT中使用或者借鉴使用。如果只是喜欢页面中的某个元素,也可以对单个元素进行收藏。

这相当于是PPT的素材夹了:

功能2:优秀PPT模板,案例

美化大师里有大量的PPT模板,你还可以细分为封面,导航页,正文页,结束页等,使用起来比模板还要方便。

功能3:一键更改字体和行距

字体和行距前文已经有介绍,相当一部分朋友没有注意过,或者认为替换比较麻烦,使用这个插件就简单多啦。

功能4:导出长图

你已经见过一些PPT长图,使用美化大师保存成长图就OK啦。

功能5:多PPT管理

打开多个PPT切换起来并不方便,有了这个插件所有打开的PPT都放在一个页面中。

通过以上PPT的梳理以及规范化,相信今后在制作PPT的时候速度一定会加快很多,颜值也会有所提升了。希望对你有帮助。

(*别忘了点击右上角关注神父*)

大家编程都用什么编辑器?

摘要:在我认识的所有程序员里,每个人几乎都有专属于自己的常用工具和相关资源,今天给大家奉上数十个程序员硬核工具,我相信这里总有一款工具是属于你的!

程序员生产力工具大全如下:

1. Idea-Intellij IDEA (java 编程语言 开发的集成环境)

业界排名第一的java开发工具,非常非常好用,如果还在用eclipse的朋友,赶紧来体验一把,你一定会爱上她的。

2. SecureCRT (SSH终端仿真程序)

SecureCRT是一款终端仿真程序,支持SSH(SSH1和SSH2)以及Telnet和rlogin协议。SecureCRT用于连接运行包括Windows、UNIX和VMS在内的远程系统的理想工具。

3. Termius (全平台的远程终端)

termius是一款全平台的远程终端,Termius不仅涵盖了Windows、Linux、OSX,还变态得支持Android和iOS(以后在地铁、公交上都可以随时拿出手机来排查线上问题啦,还真是广大程序员的福音呢。

4. Google Chrome (谷歌浏览器)

Google Chrome是一款由Google公司开发的网页浏览器,该浏览器基于其他开源软件撰写,包括WebKit,目标是提升稳定性、速度和安全性,并创造出简单且有效率的使用者界面。

5. iTerm (为Mac OS X编写的终端仿真程序)

iTerm是一个为Mac OS X编写的,功能齐全的终端仿真程序;目标是在为用户提供OS X下最佳的命令行体验;字母i代表了本地苹果的外观和风格的程序界面,并把重点放在完整的国际支持; 它合并由两个项目, CTerminal和TerminalX ,而这两者都是基于JTerminal项目;该软件非常有实用和易用性。

6. Visual Studio Code (简称“VS Code”,编写现代Web和云应用的跨平台源代码编辑器)

重新定义和优化了代码编辑,以便生成和调试新式 Web 应用程序和云应用程序。也是著名的文本编辑器,它是轻量级的,vSCode的一大特点就是你可以通过多种方式来调整设置,而且Vim可以和VScode集成在一起,它还带有一个集成终端,可用的扩展太多,使开发人员的工作变得更加轻松。我最喜欢的一些扩展是AWS Toolkit, ESLint,Live Server, Live Share, Prettier-代码格式化程序,YAML,Live Sass编译器,Docker等。

7. VMware Fusion & VMware workstation (为计算机开发的虚拟机管理程序)

是在计算机上无缝运行 Windows 的最佳方式,可确保 Windows 应用程序在计算机上实现无缝运行可以在基于 Intel 的计算机上无缝运行 Windows、Linux 以及其他 PC等多个操作系统,进而构建、测试或演示软件。

8. Navicat Premium (数据库管理工具)

Navicat premium是一款数据库管理工具,是一个可多重连线资料库的管理工具,它可以让你以单一程式同时连线到 MySQL、SQLite、Oracle 及 PostgreSQL 资料库,让管理不同类型的资料库更加的方便。

9. Postman (api调试工具)

简单来说,四个词,简单、实用、大方、美观!postman这款网页调试工具的windows客户端,功能强大的HTTP调试与模拟插件。使用Postman可以进行API开发、请求、调试,除了它,还可以使用lnsomnia和Insomnia Designer作为API文档。

10. RedisDesktopManager (一款可视化 redis管理工具 )

Redis Desktop Manager是一款简单快速、跨平台的Redis桌面管理工具,也被称作Redis可视化工具,Redis Desktop Manager官方版是一款开源软件,支持通过SSH Tunnel连接,支持windows、mac等多平台。

11. Dash (基于MAC的 API文档浏览器和代码片段管理器)

“开发者不可或缺的杰作。”Dash 可让您的 Mac 即时离线访问 200 多个 API 文档集。立刻搜索离线文件集200层+的API ,100+备忘单和 href="">更多 功能。您甚至可以"">生成自己的文档集 或 href="">请求 包含href="">文档集 。

12. Fiddler & Wireshark (http抓包工具)

Fiddler和Wireshark都是进行抓包的工具:所谓抓包就是将网络传输发送与接收的数据包进行截获、重发、编辑、转存等操作,也用来检查网络安全。作为开发者,经常想调试一下http请求发送的数据的详情,那么可以使用这2款软件。用抓包工具wireshark的人相对来说更多一些。

13. HBuilder X (HTML5的Web开发工具)

当前最快的HTML开发工具,强大的代码助手帮你快速完成开发,最全的语法库和浏览器兼容性数据让浏览器碎片化不再头痛。作为HBuilder下一代的全新编辑器,HBuilderX被定位为ide和编辑器的完美结合,除了对某种语言的语法分析、提示、转到定义、调试,同时加强了对通用文本处理能力,界面更加清爽,拥有比上一代更加有效的快捷键体系。

14. MobaXterm (远程终端控制软件,集串口,SSH远程登录和FTP传输三合一的工具)

多功能终端MobaXterm Professional Edition 是一款豪华、全功能的终端软件。MobaXterm带来了所有必要的Unix命令到Windows桌面,在开箱单便携式exe文件。MobaXterm允许您启动远程会话。远程shell,MobaXterm远比Putty好用,您可以选择创建SSH,远程登录,Rlogin,RDP,VNC,XDMCP,FTP,SFTP或串行会话。

15. Sublime Text (跨平台代码编辑器)

http://www.sublimetext.cn/

Sublime Text 是一款用于代码、标记和散文的精致文本编辑器。Sublime Text 中文网致力于为广大国内开发者提供详尽的中文文档、使用说明等,助力开发者快速掌握这个编辑器。

16.webstorm (专业的HTML编辑工具)

web开发的必备的一款开发神器,比如写js、页面、css,那么这款软件用起来非常顺手。此软件和idea出自于同一家公司,这家公司做了很多异常好用的软件,基本上你需要的各种开发相关的IDE,这家公司都生产。可以说是“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”。新版对JavaScript,TypeScript和CSS支持更好,改进了Vue.js的体验,并为Jest集成增加了新功能。

17.Xshell (功能强大的终端模拟器)

linux原创控制软件,完全免费且非常稳定的 SSH 客户端 ,支持多种远程协议,提供了很多特色与高级功能,简体中文界面也让你轻松管理远程服务器。 Xshell 的 Screen 会话不闪屏,而且可以回滚;Script 的执行顺序可以调整;可以同时发送指令到多个 session;支持布局切换等。

18. SwitchHosts (修改Hosts文件的工具)

这是用于在多个HOSTS之间进行切换。可在公用hosts文件 、当前系统hosts、本地方案和在线方案间进行切换。作为一名开发人员,经常需要修改本地host,你还是通过修改host文件来操作的么?那样太慢了,这里建议大家使用switchhosts这款软件,可以快速修改本地host,非常好用。

其他工具:

1. CodeIf(智能命名) : https://unbug.github.io/codelf

大部分开发者都或多或少遇到过变量命名的烦恼,如果命名不规范,不仅会影响开发的效率,而且对后面维护的同学来说也是一个不小的挑战,因为他要去揣摩你这个变量的含义。随着项目越来越复杂,变量和函数数量越来越多,虽然每个编程语言都有各种命名规范,但是也不能解决所有的问题。

“计算机科学里两件最难的事:缓存失效和命名。” Codelf通过搜索在线开源平台Github, Bitbucket, Google Code, Codeplex, Sourceforge, Fedora Project的项目源码,帮开发者从中找出已有的匹配关键字的变量名,从而帮助为变量名苦恼的开发者命名。这个搜索服务支持直接搜索中文。

同时可以在自己用的编辑器里安装插件,支持 VS Code、Atom、Sublime Text 和 Chrome。

2. DocsChina-印记中文 : https://www.docschina.org

这是一个前端中文文档合集,进入网站可以看到开发中经常使用的前端中文文档。如果你的英文实在不怎么好,还在为找中文文档而烦恼,这里将是你非常好的选择。记得放到自己的浏览器收藏夹里哦!

3. any-rule(正则表达大全): http://github.com/any86/any-rule

any-rule 维护了一个常用正则表达式合集,并且本身是一个支持 Web/VS Code/idea/Alfred Workflow 多平台的正则表达式工具。

4. tool.lu(在线工具): https://tool.lu

程序员总是有很多小工具要使用,比如图片、Base64编码、Markdown编辑器时间戳转换,进制转换等,在线运行各种语言代码。这个网站包含了太多程序员需要用到的小工具了。比如你想运行点JAVA代码,又不想麻烦的在系统中安装JAVA环境,可以使用里边的在线运行代码工具,然后选择JAVA,写点JAVA代码就可以直接运行了。

5. Baomitu(前端静态源库): https://cdn.baomitu.com

这个静态资源库是支持HTTP/2的CDN服务,有了它,如果你是自己的小型项目或者是做测试就不用下载任何的代码库,直接粘贴地址过来用就可以,因为是国内的CDN库,速度还非常的快。

6. Typora-Markdown(编写工具):https://www.typora.io

一款实用的 Markdown 编写工具,所见即所得,用Markdown编写文章是一个程序员的标准配置,也就是标配。现在有很多在线工具都支持Markdown,什么有道云笔记、雀语,、印象笔记等。这种简单的界面,沉浸式的编写,清晰的大纲,它就像一件称手的兵器,让你一旦拥有就爱不释手。

7. Snipaste (简单便捷的截图软件):https://zh.snipaste.com/download.html

一款免费的桌面截图软件,功能强大,使用方便,支持任何屏幕位置截图,支持窗口截图,支持快捷方式截图。您可通过截取贴图,使两张图合并为一张图,还能调整截图文字图像等等,是一款非常强大的贴图软件,喜欢此款贴图软件的朋友不要错过。

8. Captura (最好用的开源录屏、gif动态图片制作工具)

官网:https://captura.updatestar.com/ github:https://github.com/MathewSachin/Captura

通过这款工具可以帮助你轻松录制各种视频。支持全屏录制、区域录制两种方式,全屏录制可以录制全部的电脑屏幕,将电脑屏幕上所有的动态都录制下来,该软件还拥有视频编解码器,可以对视频进行解码,支持mp4、avi、GIF、webm等格式,可以满足一般的解码需要。还支持屏幕截图、剪贴板,简单的图像编辑等功能,是一款非常好用的屏幕录像工具。

9. 向日葵 (远程控制软件): https://sunlogin.oray.com/

向日葵远程控制是一款提供远程控制服务的软件。向日葵远程控制支持主流操作系统Windows、Linux、Mac、Android、iOS跨平台协同操作,在任何可连入互联网的地点,都可以轻松访问和控制安装了向日葵远程控制客户端的设备。整个远控过程,可通过浏览器直接进行,无需再安装软件。

10. Everything (本地文件检索工具):http://www.voidtools.com/support/everything/

由voidef="">tools 开发的一款文件搜索工具,这款软件是基于名称实时定位文件和目录。Everthing功能强大,体积小巧,第一次安装使用时会建立一个索引数据库,将所有文件和文件夹的名称导入其中,后续使用能够以极快的速度快速搜索,查找到你所需要的文件。

11. StarUML (UML画图工具)

画uml图的一款神器,类图、时序图、流程图、状态图等等,都可以用这款工具轻松应对。

12. uTools (生产力工具集):https://u.tools/

一个极简、插件化、跨平台的现代化桌面软件。通过自由选配丰富的插件,打造你得心应手的工具集合。这个工具,我只能说他是一款神奇,太牛逼,这款工具中汇集了很多好用的工具,可以通过这款工具秒开电脑上的各种软件。

搜索资源网站工具:

1.Bing

Bing 国际版:https://cn.bing.com/ 感觉比某度要好用多了。

2.DuckDuckGo

DuckDuckGo:https://duckduckgo.com/ 从官网的介绍来看这个搜索引擎不收集用户信息,而且没有广告。

3.Stack Overflow

Stack Overflow:https://stackoverflow.com/ 我们如果常用 Google,很多技术问题的答案就在这个网站上,如果你无法使用 Google 可以在这个网站上直接检索就好了。

4.Gitlogs

Gitlogs:https://www.gitlogs.com/ Gitlogs 是专门针对 GitHub 项目的搜索引擎,我们通过他可以快速找到想要项目。

5.jiumo search

文档搜索引擎 jiumo search 鸠摩搜书:https://www.jiumodiary.com/ 可以用来找一些技术文档手册,很多在百度网盘里。

6.Ebooke

Ebooke:https://ebookee.org/ Ebookee 是一个基于互联网并提供免费电子图书下载的搜索引擎网站。

7.Iconfinder

图标搜索:https://www.iconfinder.com/ 用来查找 logo 图片。

8.TinEye

TinEye:https://www.tineye.com 用图片来检索图片,我们可以上传图片或输入图片的 URL 来检索。

9.SemanticScholar

SemanticScholar:https://www.semanticscholar.org/ SemanticScholar 是一个免费学术搜索引擎,其检索结果来自于期刊、学术会议资料或者是学术机构的文献。

10.LibreStock

LibreStock:https://librestock.com/ LibreStock 上可以检索一些优质的高清图片。

11.CC Search

CC Search:https://ccsearch.creativecommons.org/ CC Search 上搜索到的图片资源都是无版权的,我们可以免费的使用。

12.Pexels

Pexels:https://www.pexels.com/ 高质量的图片网站,可以免费使用。

13.Unsplash

Unsplash:https://unsplash.com/ 免费高清素材网站。

14.The App Store

The App Store:https://theappstore.org/ The App Store 是一个针对苹果手机、iPad、Mac 设备的应用搜索工具。

在线画图工具:

• 在线画图工具ProcessOn:https://www.processon.com/

• 在线画图工具draw.io:https://app.diagrams.net/

• 在线思维导图工具:http://www.mindline.cn/webapp

• PlantUML在线编辑器:http://haha98k.com/

在线开发辅助工具:

日常开发经常会用到一些辅助工具我总结为8大类,包括:编解码工具、转换工具、正则工具、编译工具、网络工具、格式化工具、可视化工具、在线生成器、以及其他工具等等。 具体列表如下:

在线编码工具:

• BASE64编解码工具:https://base64.supfree.net/

• MD5编码工具:https://www.zxgj.cn/g/md5

• AES/DES加解密:http://www.fly63.com/tool/cipher/

• JWT解码工具:http://jwt.calebb.net/

• ASCII编解码工具:https://www.matools.com/code-convert-ascii

• Unicode编解码工具:https://www.zxgj.cn/g/unicode

• UTF-8编解码工具:https://www.zxgj.cn/g/utf8

• 字符串编解码工具:https://www.zxgj.cn/g/enstring

• URL编解码工具:http://tool.chinaz.com/tools/urlencode.aspx?jdfwkey=lbixz1

在线转换工具:

•在线ASCII码对照表:http://www.fly63.com/tool/ascii/

• 通用进制转换工具:https://www.zxgj.cn/g/jinzhi

• 在线浮点数十进制转换:http://www.binaryconvert.com/

• RGB颜色转换:https://www.zxgj.cn/g/yansezhi

• 时间戳转换工具:https://www.zxgj.cn/g/unix

• 计量单位换算工具:http://www.fly63.com/tool/unitable/

• 在线JSON解析:http://www.json.cn/

• 在线JS代码格式化工具:https://prettier.io/playground/

• SQL压缩/格式化工具:https://www.zxgj.cn/g/sqlformat

• JSON和XML在线转换:https://www.zxgj.cn/g/jsonxml

• JSON/YAML在线转换:http://www.fly63.com/tool/jsonyaml/

• 人民币大小写转换工具:http://www.fly63.com/tool/renmingbi/

正则表达式工具:

• 正则表达式调试工具:https://regexr.com/

• 正则表达式可视化工具:https://jex.im/regulex/

网络工具:

• IP地址归属地查询:https://www.ip138.com/

• IP地址查询:https://www.ipip.net/ip.html

• HTTP在线接口测试工具:http://www.fly63.com/php/http/

在线编译运行工具:

• C#在线编译运行:https://rextester.com/

• C/C++在线编译调试:https://www.onlinegdb.com/

• 在线编译工具套装:https://c.runoob.com/

可视化/格式化工具:

• 在线前端编辑器: https://codepen.io/

• 在线数据可视化:https://flourish.studio/

• 在线JSON解析:http://www.json.cn/

• 在线CSS代码可视化工具:https://enjoycss.com/

• XML格式化工具:https://www.zxgj.cn/g/xmlformat

• 在线JS代码格式化工具:https://prettier.io/playground/

• SQL压缩/格式化工具:https://www.zxgj.cn/g/sqlformat

• JSON和XML在线转换:https://www.zxgj.cn/g/jsonxml

• JSON/YAML在线转换:http://www.fly63.com/tool/jsonyaml/

在线生成器:

UUID在线生成器:https://www.zxgj.cn/g/uuid随机数生成器:https://www.zxgj.cn/g/suijishu

其他常用工具:

在线Nginx配置工具:https://nginxconfig.io/在线对比工具:http://www.fly63.com/tool/textdiff/在线Chrome浏览器插件:https://www.crx4chrome.com/在线接口文档管理工具:http://www.docway.net/

在线素材工具:

如果你写文章,或者做视频,那就一定少不了要找素材,包括各种图片、背景、emoji表情、表情包、壁纸、视频、gif图等等。

• 免费透明背景图片素材:http://pngimg.com/

• Emoji表情搜索:https://emoji.svend.cc/

• Emoji表情包下载:https://emojiisland.com/

• open source icons:https://feathericons.com/

• 表情包在线网站:https://fabiaoqing.com/

• 免费PNG图片库:https://pluspng.com/

• ICON图标在线下载:https://www.iconfinder.com/

• 极简壁纸:https://bz.zzzmh.cn/

• Wallpaper Abyss壁纸:https://wall.alphacoders.com

• Pixabay图片素材库:https://pixabay.com/zh/

• Unsplash图片素材库:https://unsplash.com

• Pexels图片素材库:http://www.pexels.com

• NASA图片视频素材库:https://images.nasa.gov

设计制作类工具:

对于那些文章创作者和视频创作者而言,设计封面,做海报,设计LOGO,图片美化等等基本也是刚需。

这样大概率日常会用到一些简易好上手的在线设计制作类工具,比如在线P图、音/视频轻量化剪辑、logo制作、海报设计制作、图片美化、在线图片转换或生成等等。

• 在线PS:https://www.uupoop.com/

• 在线音频剪辑:https://www.weixinsyt.com/

• 在线视频剪辑:https://www.kapwing.com/

• 免费logo在线制作:http://www.uugai.com/

• 艺术字体在线生成:https://www.qt86.com/

• 在线表格转换工具: https://tableconvert.com/

• 在线海报设计工具: https://www.designcap.com/

• 图片智能放大工具:https://bigjpg.com/

• 二维码美化器:https://mh.cli.im/

• 在线代码截图工具:https://carbon.now.sh/

• 在线抠图工具:https://www.remove.bg/zh

• ICO图标在线生成:http://www.fly63.com/php/ico/

• SVG转PNG工具:http://www.fly63.com/tool/svg2img/

• 视频转GIF工具:http://www.fly63.com/tool/giftxt/

• 二维码在线生成器:http://www.fly63.com/tool/ewm/

• 二维码在线解码:http://www.fly63.com/php/decoder/

写辅助工具:

写文章的过程中经常会用到和写作相关的辅助工具,比方说:字数统计工具、Markdown格式的文章排版工具、图床网站、代码截图工具等等,所以下面这些在线工具就能很好地满足我的需求。

• 在线字数统计:https://www.eteste.com/

• mdnice markdown排版工具:https://mdnice.com/

• md2all markdown排版工具:http://md.aclickall.com/

• 在线图床神器:https://picx.xpoet.cn/

• 在线免费图床:https://sm.ms/

• 图壳图床:https://imgkr.com/

• 在线代码截图工具:https://carbon.now.sh/

• 在线短链接工具:https://urlify.cn/

• 在线文本替换:http://www.fly63.com/tool/textreplace/

在线办公工具:

部分在线工具主要用来处理一些和文档以及文稿相关的事情,经常用到的比如:在线的全套pdf处理和转换工具、各种各样多媒体文件间的相互转换工具、在线识别工具、在线压缩工具等等。

• pdf在线处理工具1:https://smallpdf.com/cn/pdf-tools

• pdf在线处理工具2:https://tools.pdf24.org/zh/

• pdf转word在线工具:https://www.pdftoword.com/

• 在线多媒体转换器合集:https://cn.office-converter.com/

• 在线文字识别工具:https://ocr.wdku.net/

• 在线文件压缩工具:https://docsmall.com/

文档笔记工具:

好记性不如烂笔头,作为一个学习者,我觉得记笔记是必不可少的步骤。当然现在基本都做电子笔记和电子文档比较多。 现如今各式各样优秀的文档工具和笔记软件鳞次栉比,好用的也有很多,整理成如下列表,这东西各有长处,使用哪个最合意还得看个人习惯和需求了。

• 印象笔记:https://www.yinxiang.com/

• 有道笔记:https://note.youdao.com/

• OneNote:https://www.onenote.com/

• 幕布:https://mubu.com/

• 为知笔记:https://www.wiz.cn/

• 石墨文档:https://shimo.im/

• Simplenote:https://simplenote.com/

• 语雀:https://www.yuque.com/

编程学习网:

• 哔哩哔哩:https://www.bilibili.com/

• C语言网:https://www.dotcpp.com/

• cppreference:http://zh.cppreference.com/

• 中国大学MOOC:https://www.icourse163.org/

• 牛客网:www.nowcoder.com

• 网易公开课:open.163.com

• CodeGym:https://codegym.cc/

• BeginnersBook:https://beginnersbook.com/

• JavaSED:http://www.javased.com/

• codecademy:https://www.codecademy.com/

• Coursera:https://www.coursera.org/

• StackOverFlow:https://stackoverflow.com/

• LeetCode:https://leetcode-cn.com/

• LintCode:https://www.lintcode.com/

在线教程文档:

这部分主要集中了在做开发过程中随手参考所要用到的几乎所有在线教程和官方文档,有中文版文档的基本都优先列出来了,但更多时候是英文的官方文档。

• Git中文教程:https://git-scm.com/book/zh/v2

• SVN中文手册:http://svnbook.red-bean.com/nightly/zh/index.html

• jQuery API中文文档:https://jquery.cuishifeng.cn/

• Nginx中文文档:https://www.nginx.cn/doc/index.html

• Kafka中文文档:https://kafka.apachecn.org/

• Mybatis中文文档:https://mybatis.org/mybatis-3/zh/index.html

• 微信小程序官方文档:https://developers.weixin.qq.com/miniprogram/dev/framework/

• Nodejs中文教程文档:http://nodejs.cn/learn

• Apache Web Server文档:http://httpd.apache.org/docs/

• Spring文档中文版:https://www.springcloud.cc/spring-reference.html

• Golang标准库文档中文版:https://studygolang.com/pkgdoc

• Java 8官方文档:https://docs.oracle.com/javase/8/docs/api/index.html

• Maven官方文档:http://maven.apache.org/guides/

• Tomcat 8官方文档:http://tomcat.apache.org/tomcat-8.0-doc/index.html

• Spring Boot官方文档:https://docs.spring.io/spring-boot/docs/current/reference/htmlsingle/

• RabbitMQ官方文档:https://www.rabbitmq.com/documentation.html

• RocketMQ官方文档:http://rocketmq.apache.org/docs/quick-start/

• Dubbo中文文档:https://dubbo.apache.org/zh/docs/

• Netty官方文档:https://netty.io/wiki/index.html

• Elasticsearch官方文档:https://www.elastic.co/guide/en/elasticsearch/reference/current/index.html

• Spring Cloud官方文档:https://spring.io/projects/spring-cloud

• Docker官方文档:https://docs.docker.com/get-started/

• kubernetes中文文档:https://kubernetes.io/zh/docs/home/

• thymeleaf官方文档:https://www.thymeleaf.org/documentation.html

• Vue.js中文文档:https://cn.vuejs.org/v2/guide/

• React.js官方文档:https://reactjs.org/docs/getting-started.html

• Jenkins中文文档:https://www.jenkins.io/zh/doc/

华为云平台:

高效易用的低代码aPaaS平台-应用魔方AppCube:https://www.huaweicloud.com/product/appcube.html集华为研发实践、前沿研发理念、先进研发工具为一体的软件开发平台-软件开发平台 DevCloud:https://www.huaweicloud.com/devcloud/

以上内容分享自华为云社区《吐血整理:程序员都在用什么工具?》,作者: 考过IE励志当攻城狮 ,部分内容整理自互联网~

有没有运用机器学习处理文本分类问题的教程?

这是python spaCy文本分类的使用教程,里面还有机器学习模型scikit-learn,你可以参考一下,有助于你解决问题,代码什么都有

文本是极其丰富的信息源。人们每分钟都会发送数亿封新电子邮件和短信。确实有大量的文本数据等待挖掘见解。但是,想要从所有文本数据中收集含义的数据科学家面临着一个挑战:由于它以非结构化形式存在,因此难以分析和处理。

在大数据分析Python中spaCy文本分类使用教程中,我们将研究如何使用有用的Python包spaCy(文档)将所有这些非结构化文本数据转换为对分析和自然语言处理更有用的内容。

完成此操作后,我们将能够从文本数据中得出有意义的模式和主题。这在多种数据科学应用程序中很有用:垃圾邮件过滤,支持通知单,社交媒体分析,上下文广告,查看客户反馈等。

具体来说,我们将对自然语言处理(NLP)进行更高层次的研究。然后,我们将完成一些重要的基本操作,以使用清理和分析文本数据spaCy。然后,我们将使用一些实际数据(亚马逊的Alexa智能家居扬声器的文本评论)深入研究文本分类,特别是Logistic回归分类。

什么是自然语言处理?

自然语言处理(NLP)是机器学习的一个分支,致力于处理,分析和有时生成人类语音(“自然语言”)。

毫无疑问,在确定文本字符串的含义方面,人类仍然比机器好得多。但是在数据科学中,我们经常会遇到太大的数据集,以至于人们无法在合理的时间内对其进行分析。我们还可能遇到没有人可以分析和响应一段文本输入的情况。在这种情况下,我们可以使用自然语言处理技术来帮助机器对文本的含义有所了解(并在必要时做出相应的响应)。

例如,自然语言处理在情感分析中被广泛使用,因为分析人员经常试图从大量文本数据中确定整体情感,这对于人类进行梳理是很费时的。它也用于广告匹配中-确定文本主体并自动分配相关广告。它用于聊天机器人,语音助手和其他需要机器理解并快速响应自然人类语言形式的输入的应用程序。

分析和处理文本 spaCy

spaCy是Python的开源自然语言处理库。它是专门为生产用途而设计的,它可以帮助我们构建可有效处理大量文本的应用程序。首先,让我们看一下spaCy可以处理的一些基本分析任务。

正在安装 spaCy

spaCy在继续进行操作之前,我们需要先安装它及其英语模型。我们可以使用以下命令行命令执行此操作:

pip install spacy

python -m spacy download en

我们也可以spaCy在Juypter Notebook中使用。不过,它不是Jupyter默认包含的预安装库之一,因此我们需要从笔记本计算机运行这些命令以将其spaCy安装在正确的Anaconda目录中。请注意,我们!在每个命令前面都使用来让Jupyter笔记本知道应将其作为命令行命令读取。

!pip install spacy

!python -m spacy download en

标记文本

标记化是将文本分成多个部分的过程,称为标记,并忽略标点符号(,。'')和空格之类的字符。spaCy的令牌生成器以Unicode文本形式接受输入,并输出一系列令牌对象。

让我们看一个简单的例子。假设我们有以下文本,并且我们希望对其进行标记化:

我们可以采用几种不同的方法来解决这个问题。第一种称为单词标记化,即将文本分解成单个单词。对于许多语言处理应用程序而言,这是至关重要的一步,因为它们通常需要以单个单词而不是更长的字符串形式输入。

在下面的代码中,我们将导入spaCy及其英语模型,并告诉我们将使用该模型进行自然语言处理。然后,我们将文本字符串分配给text。使用nlp(text),我们将处理该文本spaCy并将结果分配给名为的变量my_doc。

至此,我们的文本已经被标记化了,但是spaCy将标记化的文本存储为文档,我们希望以列表形式查看它,因此我们将创建一个for循环遍历文档的循环,并为其添加每个单词标记在文本字符串中找到一个名为的列表,token_list以便我们可以更好地了解单词的标记方式。

如我们所见,spaCy生成一个包含每个标记作为单独项目的列表。请注意,它已经认识到诸如之类的收缩实际上不应代表两个不同的词,因此已将它们分解为两个不同的标记。

首先,我们需要加载语言词典,在上面的示例中,我们使用English()类加载英语词典并创建nlp nlp对象。“ nlp”对象用于创建具有语言注释和各种nlp属性的文档。创建文档后,我们将创建令牌列表。

如果需要,我们还可以将文本分为句子而不是单词。这称为句子标记化。在执行句子标记化时,标记化程序会查找介于句子之间的特定字符,例如句点,惊叹号和换行符。对于句子标记化,我们将使用预处理管道,因为使用的句子预处理spaCy包括标记器,标记器,解析器和实体识别器,我们需要访问它们才能正确识别什么是句子,什么不是。

在下面的代码中,spaCy标记文本并创建一个Doc对象。这个Doc对象使用我们预处理管道的组件标记器,解析器和实体识别器将文本分解为组件。从该管道中,我们可以提取任何组件,但是在这里,我们将使用该sentencizer组件访问句子标记。

同样,spaCy已将文本正确解析为所需的格式,这一次输出了在源文本中找到的句子列表。

清理文本数据:删除停用词

我们使用的大多数文本数据将包含许多实际上对我们没有用的单词。这些称为停用词的词在人类语音中很有用,但对数据分析没有多大帮助。删除停用词可以帮助我们消除文本数据中的杂音和干扰,还可以加快分析时间(因为要处理的词更少)。

让我们看看spaCy默认情况下包含的停用词。我们将spaCy其英语模型中的停用词导入并分配给名为的变量,spacy_stopwords以便我们进行查看。

如我们所见,spaCy的默认停用词列表包括312个条目,每个条目都是一个单词。我们还可以看到为什么其中许多单词对数据分析没有用处。例如,尽管如此,过渡词对于理解句子的基本含义并不是必需的。而诸如“ 某人”之类的词太含糊,以至于无法用于NLP任务。

如果需要,我们还可以创建自己的自定义停用词列表。但是出于我们在大数据分析Python中spaCy文本分类使用教程中的目的,spaCy提供的默认列表会很好。

从我们的数据中删除停用词

现在我们有了停用词列表,让我们使用它从上一部分中正在研究的文本字符串中删除停用词。我们的文本已经存储在变量中text,因此我们不需要再次定义它。

相反,我们将创建一个名为的空列表filtered_sent,然后遍历doc变量以查看源文本中每个标记化的单词。spaCy包括一堆有用的标记属性,我们将使用其中的一个is_stop来识别不在停用词列表中的单词,然后将它们附加到filtered_sent列表中。

不难理解为什么停用词会有所帮助。删除它们将我们的原始文本简化为仅几个单词,这使我们对句子正在讨论的内容有了一个很好的了解:学习数据科学,并在此过程中避免挑战和挫折。

词汇规范化

词典标准化是文本数据清除过程中的又一步。总体而言,归一化将高维特征转换为适合任何机器学习模型的低维特征。出于这里的目的,我们只考虑lemmatization,即一种处理单词以使其根源减少的方法。

合法化

合法化是一种处理以下事实的方法:尽管connect,connection,connecting,connected等词并不完全相同,但它们都具有相同的基本含义:connect。拼写上的差异在口语中具有语法功能,但是对于机器处理,这些差异可能会造成混淆,因此我们需要一种方法来将所有单词形式的单词connect变成单词connect self。

一种执行此操作的方法称为“ 阻止”。词干涉及简单地去除容易识别的前缀和后缀,以产生通常是单词最简单的版本。例如,连接将删除-ion后缀,并正确地减小以连接。这种简单的词干通常是需要的,但是词义化(实际上是查看字典中描述的词及其词根(称为lemma))(只要词存在于字典中)更为精确。

由于spaCy包含了将单词分解为引理的内置方法,因此我们可以简单地将其用于引理。在以下非常简单的示例中,我们将使用它.lemma_为要分析的每个单词产生引理。

词性(POS)标记

单词的词性定义了它在句子中的功能。例如,名词标识一个对象。形容词描述一个对象。动词描述动作。在句子的上下文中识别和标记每个单词的语音部分称为词性标记或POS标记。

让我们尝试使用POS标记spaCy!我们需要导入其en_core_web_sm模型,因为其中包含进行此分析所需的字典和语法信息。然后,我们需要做的就是将这个模型加载.load()并遍历我们的新docs变量,使用确定每个单词的词性.pos_。

(注意û中u"All is well that ends well."表示该字符串是Unicode字符串。)

spaCy已正确识别出该句子中每个单词的词性。能够识别词性在各种与NLP相关的上下文中很有用,因为它有助于更准确地理解输入句子并更准确地构建输出响应。

实体检测

实体检测,也称为实体识别,是语言处理的一种更高级形式,它可以识别文本输入字符串中的重要元素,例如位置,人物,组织和语言。这对于快速从文本中提取信息非常有帮助,因为您可以快速挑选出重要的主题或确定文本的关键部分。

我们将为.label文本中检测到的每个实体获取一个标签,然后使用spaCy的displaCy显示工具以更直观的格式查看这些实体。

使用这种技术,我们可以识别文本中的各种实体。该spaCy文档提供了受支持的实体类型的完整列表,从上面的简短示例中我们可以看出,它能够识别各种不同的实体类型,包括特定位置(GPE),与日期相关的单词(DATE),重要数字(CARDINAL),特定个人(PERSON)等。

使用displaCy我们还可以可视化我们的输入文本,每个标识的实体都用颜色突出显示并标记。我们将style = "ent"用来告诉displaCy我们要在此处可视化实体。

依赖解析

独立性分析是一种语言处理技术,它使我们可以通过分析句子的构造来确定各个单词之间的相互关系,从而更好地确定句子的含义。

例如,考虑句子“比尔掷球”。我们有两个名词(比尔和球)和一个动词(掷)。但是我们不能只单独看这些话,否则我们可能最终以为球在扔比尔!为了正确理解句子,我们需要查看单词顺序和句子结构,而不仅仅是单词及其词性。

这样做非常复杂,但值得庆幸的是,spaCy它将为我们完成工作!在下面,让我们spaCy从新闻头条中再加上一句话。然后,我们将使用另一个spaCy名为的noun_chunks,它将输入分解为名词和描述它们的单词,并遍历源文本中的每个块,从而识别单词,其词根,其依赖项标识以及它属于哪个块。

该输出可能有点难以理解,但是由于我们已经导入了displaCy可视化工具,因此我们可以使用它来查看依赖关系图,其中使用style = "dep"起来更容易理解:

当然,我们还可以查看有关依赖关系解析spaCy的文档,以更好地了解根据解释每个句子的方式可能应用于文本的不同标签。

词向量表示

当我们单看单词时,机器很难理解人类会立即理解的联系。例如,引擎和汽车似乎有一个明显的连接(汽车使用引擎运行),但是这种连接对计算机而言并不那么明显。

值得庆幸的是,有一种方法可以表示可以捕获更多此类连接的单词。甲字矢量是commuicates其换句话说关系的词的数字表示。

每个单词都被解释为唯一且冗长的数字数组。您可以将这些数字视为GPS坐标之类的东西。GPS坐标由两个数字(纬度和经度)组成,如果我们看到两组GPS坐标在数字上彼此接近(如43--70和44--70),我们会知道这两个位置相对紧靠在一起。词矢量与此类似,虽然有很多分配给每个单词超过两个坐标,所以他们对人类眼球更难。

使用spaCy的en_core_web_sm模型,让我们看一个单词的向量长度,以及使用.vector和看起来的向量.shape。

人们无法观察到该数组并将其识别为“芒果”的含义,但是以这种方式表示该单词对机器而言效果很好,因为它使我们能够代表该单词的含义及其与其他相似单词的“接近度”使用数组中的坐标。

文字分类

现在,我们已经看了一些spaCy一般可以完成的很酷的事情,让我们看一下这些自然语言处理技术中的一些更大的实际应用:文本分类。通常,我们可能会发现自己想要根据一些参数(例如,每个片段的主题)进行分类的一组文本数据,而文本分类将帮助我们做到这一点。

下图显示了在对文本进行分类时我们想要做什么的全景视图。首先,我们从源文本(及其附带的任何标签或元数据)中提取所需的功能,然后将清理后的数据馈送到为我们进行分类的机器学习算法中。

导入库

我们将从导入此任务所需的库开始。我们已经导入了spaCy,但是我们也想要pandas并scikit-learn帮助进行分析。

加载数据中

上面,我们看了一些使用进行文本分析的简单示例spaCy,但是现在我们将使用进行一些Logistic回归分类scikit-learn。为了使这一点更加现实,我们将使用真实的数据集-这组Amazon Alexa产品评论。

该数据集以制表符分隔的文件(.tsv)的形式出现。它已经有五列:rating,date,variation,verified_reviews,feedback。

rating表示每个用户给Alexa的评分(满分5分)。date指示审查日期,并variation描述用户审查的型号。verified_reviews包含每个评论的文本,并feedback包含一个情感标签,其中1表示正面情绪(用户喜欢),0表示负面情绪(用户不喜欢)。

该数据集包含消费者对亚马逊Echos,Echo Dots,Alexa Firesticks等Alexa产品的评论。我们要做的是开发一个分类模型,该模型查看评论文本并预测评论是正面还是负面。由于此数据集已在该feedback列中包含评论是肯定的还是否定的,因此我们可以使用这些答案来训练和测试我们的模型。我们的目标是生成一个准确的模型,然后将其用于处理新的用户评论,并快速确定它们是正面还是负面。

首先,将数据读取到数据pandas框中,然后使用pandas的内置函数来帮助我们仔细查看数据。

使用标记数据 spaCy

现在我们知道我们正在使用什么,让我们使用创建一个自定义标记器函数spaCy。我们将使用此功能自动从每个评论中剥离不需要的信息,例如停用词和标点符号。

我们将从导入所需的英语模型spaCy以及Python的string模块开始,该模块包含一个有用的清单,其中列出了我们可以在中使用的所有标点符号string.punctuation。我们将创建包含要删除的标点符号和停用词的变量,以及一个通过spaCy英文模块运行输入的解析器。

然后,我们将创建一个spacy_tokenizer()函数,该函数接受一个句子作为输入,并将该句子处理为标记,执行词形化,小写并删除停用词。这类似于我们在大数据分析Python中spaCy文本分类使用教程前面的示例中所做的操作,但是现在我们将所有内容放到一个函数中,以预处理要分析的每个用户评论。

定义自定义变压器

为了进一步清除文本数据,我们还需要创建一个自定义转换器,以删除开头和结尾的空格并将文本转换为小写形式。在这里,我们将创建一个predictors继承TransformerMixin类的自定义类。该类重写transform,fit和get_parrams方法。我们还将创建一个clean_text()删除空格并将文本转换为小写字母的函数。

矢量化特征工程(TF-IDF)

在对文本进行分类时,最终得到的是与相应标签匹配的文本片段。但是我们不能在我们的机器学习模型中简单地使用文本字符串。我们需要一种将文本转换为可以用数字表示的内容的方法,就像标签(正数为1,负数为0)一样。在正面和负面标签中对文本进行分类称为情感分析。因此,我们需要一种数字表示文本的方法。

我们可以用来执行此操作的一种工具称为Word of Words。BoW将文本转换为给定文档中单词出现的矩阵。它着眼于给定单词在文档中是否出现,并生成一个矩阵,我们可以将其称为BoW矩阵或文档术语矩阵。

我们可以通过为我们的文本数据弓矩阵scikit-learn的CountVectorizer。在下面的代码中,我们告诉CountVectorizer使用spacy_tokenizer构建的自定义函数作为其标记生成器,并定义所需的ngram范围。

N-gram是给定文本中相邻单词的组合,其中n是插入标记中的单词数。例如,句子“谁将在2022年赢得世界杯足球赛?” 字母组合是一个单词序列,例如“ who”,“ will”,“ win”等。二元组将是两个连续单词的序列,例如“谁将”,“将获胜”,等等。大数据分析Python中spaCy文本分类使用教程https://www.aaa-cg.com.cn/xmt/2338.html因此,ngram_range我们将在下面的代码中使用的参数设置ngram的上下限(我们将使用unigram)。然后,我们将ngram分配给bow_vector。

我们还希望查看术语的TF-IDF(术语频率-反文档频率)。这听起来很复杂,但这只是通过查看每个单词的频率与文档频率的比较来规范我们的单词袋(BoW)的一种方式。换句话说,这是一种表示特定术语在给定文档中的重要性的方法,它基于该术语出现了多少次以及该术语出现在其他文档中的数量。TF-IDF越高,这个词对那个文件更重要。

我们可以用以下数学方程式表示:

当然,我们不必手工计算!我们可以使用scikit-learn的TfidfVectorizer 自动生成TF-IDF 。再次,我们将告诉它使用与我们一起构建的自定义标记生成器,spaCy然后将结果分配给变量tfidf_vector。

将数据分为训练集和测试集

我们正在尝试建立分类模型,但是我们需要一种方法来了解其实际表现。将数据集分为训练集和测试集的方法是经过实践检验的。我们将一半的数据集用作训练集,其中将包含正确的答案。然后,我们将使用数据集的另一半测试模型,而无需给出答案,以查看其执行的准确性。

便利,scikit-learn为我们提供了一个内置的这样做的功能:train_test_split()。我们只需要告诉它要分割的功能集(X),要对其进行测试的标签(ylabels)以及要用于测试集的大小(以十进制形式的百分比表示)。

创建管道并生成模型

现在我们已经完成了所有的设置,现在是时候实际构建模型了!我们将从导入LogisticRegression模块并创建LogisticRegression分类器对象开始。

然后,我们将创建一个包含三个组件的管道:清理器,向量器和分类器。清洁器使用我们的predictors类对象来清洁和预处理文本。向量器使用countvector对象为文本创建词袋矩阵。分类器是执行逻辑回归以对情感进行分类的对象。

建立此管道后,我们将使用来装配管道组件fit()。

评估模型

让我们看一下我们的模型实际表现如何!我们可以使用中的metrics模块执行此操作scikit-learn。现在我们已经训练了模型,我们将把测试数据通过管道进行预测。然后,我们将使用metrics模块的各种功能来查看模型的准确性,准确性和召回率。

1)准确性是指我们的模型做出的完全正确的预测总数中的百分比。

2)精度描述了我们预测中真实阳性与真实阳性加假阳性的比率。

3)回忆描述了我们的预测中真实阳性与真实阳性加假阴性的比率。

上面的文档链接提供了每个术语的更多详细信息和更精确的定义,但最重要的是,所有三个指标的测量范围均为0到1,其中1完全正确地预测了所有指标。因此,模型的得分越接近1,就越好。

换句话说,总体而言,我们的模型在94.1%的时间内正确地识别了评论的情绪。当它预测评论是正面的时,该评论实际上在95%的时间内是正面的。当进行正面评价时,我们的模型将其确定为正面评价的时间为98.6%

资源和后续步骤

在大数据分析Python中spaCy文本分类使用教程的整个过程中,我们已经从执行一些非常简单的文本分析操作spaCy到使用来构建自己的机器学习模型scikit-learn。当然,这仅仅是个开始,两者还有很多spaCy,scikit-learn必须提供给Python数据科学家。

https://www.toutiao.com/i6841453880681693710/