如何用Python做词云(收藏)

0、如果原先装了ceph,则先卸载

图片 1

sudo stop ceph-all                                                                         //停止所有CEPH进程
ceph-deploy uninstall  [{ceph-node}]                                             //卸载所有ceph程序
ceph-deploy purge   [[ceph-node} [{ceph-node}]                           //删除ceph相关的包
ceph-deploy purgedata {ceph-node} [{ceph-node}]                       // 删除ceph相关的包
ceph-deploy forgetkeys                                                                  //删除key

图片 2

  

图片 3

1、修改/etc/hosts,使主机名对承诺本机的IP地址(若选择回环地址127.0.0.1貌似解析不了域名)。注:以下主机名都为monster,读者需要将其转移也自己之主机名

关押了以后您发啊感觉?想不思量协调举行同样张出来?

10.10.105.78    monster
127.0.0.1       localhost

若是你的答案是大势所趋之,我们虽不要拖了,今天就来一步步从零开始做个词云分析图。当然,做吧根基的词云图,肯定不如刚才那片摆信息图酷炫。不过没什么,好的开始是马到成功的一半嘛。食髓知味,后面你虽可以协调升级技术,进入而开挂的成功之路。

 

网上教而开信息图的教程很多。许多且是动了专用工具。这些工具好是好,便捷而强。只是她功能还不过过把一,适用范围有限。今天咱们设尝尝的,是因此通用的编程语言Python来做词云。

2、创建目录ceph并登

Python是一致栽时很流行的编程语言。你不光可以为此其举行多少解析以及可视化,还会就此来举行网站、爬取数据、做数学题、写脚论为而偷懒……

 

知豆瓣吗?它一律开始便之所以Python写的。

3、准备一定量独片设备(可以是硬盘也得以是LVM卷),这里我们利用LVM

每当现阶段底编程语言热度排序里,Python屈居第四(当然,很多人口非容许,所以编程语言的排行榜产生过多,你懂的)。但看问题而因此提高意见。随着数据正确的上进,Python有突发的大势。早点儿站及风口,很有裨益。

   dd if=/dev/zero of=ceph-volumes.img bs=1M count=8192 oflag=direct
   sgdisk -g --clear ceph-volumes.img
   sudo vgcreate ceph-volumes $(sudo losetup --show -f ceph-volumes.img)
   sudo lvcreate -L2G -nceph0 ceph-volumes
   sudo lvcreate -L2G -nceph1 ceph-volumes
   sudo mkfs.xfs -f /dev/ceph-volumes/ceph0
   sudo mkfs.xfs -f /dev/ceph-volumes/ceph1
   mkdir -p /srv/ceph/{osd0,osd1,mon0,mds0}
   sudo mount /dev/ceph-volumes/ceph0 /srv/ceph/osd0
   sudo mount /dev/ceph-volumes/ceph1 /srv/ceph/osd1

假设你之前并未编程基础,没提到。从零开始,意味着我会让你怎样设置Python运行环境,一步步得词云图。希望您绝不杀浏览,而是亲自动手尝试一番。到就的那无异步,你不仅可以做出第一摆设词云图,而且就尚用是您的第一独有效的编程作品。

  根据上面的下令我们创建了一定量只虚拟磁盘ceph0和ceph1并分别挂载到/srv/ceph/osd0和/srv/ceph/osd1目录下

心动了?那我们就算从头吧。

 

安装

率先,我们用装Python运行环境。

一经您用之凡macOS,那么你的系里面其实都预装好了Python。

可是我们设动及博恢弘包的效能。因此最好好安装一个Python工具套装。只需要同次于安装,以后大部分之效力就都曾经购并了。不必每次用新力量,都去零敲碎打地设置新保险了。

Python的套装有诸多种,这里推荐给大家anaconda。因为经自己4年多底品尝和对比,感觉就款软件包的装置更为方便,扩展包之含有范围以及布局更合理。

吁您及 这个网址
下载anaconda套装。下拉网页找到下载位置。根据你的操作系统类型选择恰当的版本。

图片 4

因为我的网是macOS,所以网站一直叫自家推荐的即是macOS系统版本。但要您用的凡Windows或Linux,请切换到对应的标签页上面。

图片 5

无您用底凡何人操作系统,请留心右侧的有限个按钮,分别针对应Python
2.X与3.X版本。有人一定很迷惑,既然有新的本,我不管什么用老的?

莫是这么的。到2020年之前,Python的片独版会一直并存。Python的开发者确实要大家升级切换至3.X本子。可惜目前3.X本兼容的扩充包数量比较2.X版要少,尤其是涉到数量科学类的软件包,就越是明显。所以要你是新大方,我提议乃下载2.X(目前是2.7)版本,这样在此后的用被,可能遇到的题目会少一些。等而用娴熟了,再徙至3.X版不迟。相信自己,到那儿您会很快适应新本子的。

下载后,执行安装文件就推行了。

因你的处理器运行速度不同,安装之光阴长短不对等。耐心点儿,只需要相当即时同软嘛。

装完毕后,请你安装一个“现代化”浏览器。如果你用底是macOS,那么网自带的Safari就老大好。其他的选包括Firefox和Google
Chrome。

求安装上述浏览器之一,然后用那安装也系统默认的浏览器。

好了,下面请入命令行模式。

以macOS和Linux下,你待开启一个巅峰(terminal)。

图片 6

设若是Windows,请打开“开始”-“附件”-“命令提示符”。

图片 7

键入以下命令:

mkdir democd demo

吓了,你本有一个专用的目录,叫做demo了。请到macOS的Finder或者Windows的“我的微处理器”里面,找到这目录并且打开她。

回来终端下面,macOS或者Linux用户要键入以下命令:

pip install wordcloud

macOS会提示您先安装XCode命令行工具,你按照默认设置一步步进行就足以了。但是要留意,务必于WiFi环境下安装。如果您用底凡4G流量,那你可要破费一笔画了。

一经你用的凡Windows,那么以使这词云包,就有点麻烦一些,你待到
这里 下充斥 wordcloud‑1.3.1‑cp27‑cp27m‑win32.whl
夫文件。下载后用她拖拽到公的demo目录里。

以命令行下,先实施:

pip install wheel

然后,再执行:

pip install wordcloud‑1.3.1‑cp27‑cp27m‑win32.whl

好了,我们需要之总体Python运行条件到底装好了。

伸手务必按照上述手续执行,确保各一样步都曾经顺利完成。否则要遗漏,后面运行程序会报错。

4、安装ceph-deploy

数据

词云分析的对象,是文本。

辩论及摆,文本可以是各种语言的。英文、中文、法文、阿拉伯文……

以便利,我们这边以英文文本为条例。你得随心所欲到网上搜寻一篇英文文章作为分析对象。我特意喜欢英剧”Yes,
minister”,所以到维基百科上找到了这部剧的牵线词条。

图片 8

自我把其中的正文文字有拷贝了下去,存储吗一个文件文件,叫做yes-minister.txt。

拿这文件挪动到我们的办事目录demo里。

吓了,文本数据就准备好了。开始进入编程的魔幻世界吧!

sudo apt-get install ceph-deploy

代码

每当指令行下,执行:

jupyter notebook

浏览器会自动开,并且显示如下界面。

图片 9

及时虽是我们刚才的劳动成果——安装好之周转条件了。我们还尚未编写程序,目录下就来一个刚刚生成的文书文件。

开拓这个文件,浏览一下情。

图片 10

回到Jupyter笔记本的主页面。我们点击New按钮,新建一个笔记本(Notebook)。在Notebooks里面,请捎Python
2选项。

图片 11

网会提醒我们输入Notebook的称号。程序代码文件之称呼,你得随便起。但是自己建议乃从一个起意义之名字,将来好方便寻找。由于我们而尝尝词云,就深受它们wordcloud好了。

图片 12

下一场就是应运而生了一个空的记录本,供我们用了。我们于网页里唯一的代码文本框里,输入以下3长长的语句。请务必逐字根据示例代码输入,空格数量还非得以来反差。尤其令人瞩目第三履行,用4独空格,或者1个Tab开始。输入后,按Shift+Enter键,就可实行了。

filename = "yes-minister.txt"with open(filename) as f:

尚未其它结果什么。

对,因为咱们这边没有任何输出动作,程序只是开辟了你的yes-minister.txt文本文件,把中的始末还读了出,存储到了一个叫作mytext的变量里面。

然后我们品尝显示mytext的情节。输入以下语句之后,还是得按Shift+Enter键,系统才会实际执行该语句。

mytext

日后的步调里,也绝不要忘记了及时同样肯定实施动作。

展示的结果要下图所展示。

图片 13

啊,看来mytext变量里积存的公文就是咱们从网上选来的字。到目前为止,一切正常。

然后我们呼唤(import)词云包,利用mytext中蕴藏的文件内容来打造词云。

from wordcloud import WordCloud

此刻程序可能会见报警。别担心。警告(warning)不影响程序的正规运作。

图片 14

这词云分析都好了。你没看错,制作词云的中坚步骤只待立即2行语,而且首先久还只是于扩大包里找找外援。但是程序并无见面被咱展示任何东西。

说好了之乐章曰也?折腾了这样半上,却什么吧并未,你蒙人吗?!

变激动。输入下面4行语句后,就是见证奇迹有的随时了。

%pylab inlineimport matplotlib.pyplot as plt

运作结果如图所示:

图片 15

切莫用那兴奋嘛。

您得在词云图片及单机鼠标右键,用“图片旁存为”功能导出。

图片 16

经过这张词云图,我们得望不同单词和词组出现的效率高低差别。高频词的书体明显更可怜,而且颜色为殊醒目。值得说明的凡,最显眼的单词Hacker并无是凭黑客,而是因部剧的中坚之一——哈克首相。

含程序完整代码的ipynb文件,我耶享受了出,你可以从 这里 下充斥。

愿意您于品味过程遭到一切顺利。对自己别的词说图满意为?如果你不好听,也没什么,可以打wordcloud软件包的其余高级功能。尝试一下,看自己力所能及免可知做出如此的歌词曰图来?学习过程被遇见什么问题或想博得学习资源的说话,私聊我

 

5、创建工作目录,进入并创集群

   mkdir ceph-cluster
   cd ceph-cluster
   ceph-deploy new  monster //创建一个新集群,并写入CLUSTER.conf和keyring等等

  以我们是以单节点上工作,因此需要修改一下配备文件

echo "osd crush chooseleaf type = 0" >> ceph.conf
echo "osd pool default size = 1" >> ceph.conf
echo "osd journal size = 100" >> ceph.conf

 

6、安装Ceph基本库(ceph,ceph-common, ceph-fs-common, ceph-mds)

ceph-deploy install monster

  不过自己通过上面的道安装好像有些问题……于是一直apt-get install
ceph也实施

 

7、创建一个集群监视器

ceph-deploy mon create monster

 

8、收集远程节点上的密钥到手上文件夹

ceph-deploy gatherkeys monster

 

9、增加OSD,就于咱们挂载虚拟磁盘的目录

ceph-deploy osd prepare monster:/srv/ceph/osd0
ceph-deploy osd prepare monster:/srv/ceph/osd1

 

10、激活OSD

sudo ceph-deploy osd activate monster:/srv/ceph/osd0
sudo ceph-deploy osd activate monster:/srv/ceph/osd1

  [ceph_deploy][ERROR ] RuntimeError: Failed to execute command:
ceph-disk -v activate –mark-init upstart –mount /srv/ceph/osd0

  激活时碰到如达到所显示之荒唐时,使用命令 sudo chown ceph:ceph
/srv/ceph/osd0解决(不过之前举行过osd的磁盘,遇到这题目用这种艺术一般解决不了….)

 

11、复制 admin 密钥到任何节点

ceph-deploy admin monster

 

12、验证

sudo ceph health
sudo ceph osd tree 

  

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注