有一种熬夜澳门美高梅手机网站,叫赢一把再睡

数据处理

后面爬虫的时候为了存储方便,把一个用户关联的话题以及各种话题下的应对景况存放一个长的字符串,那是一个坑。现在为了建模,得先把多少处理一下,用Python正则表明式从长字符串中把话题id抽取出来,然后使之变成一对多的盘整的结构化数据框。这么些进度使3220712行数据变成了36856177行。

——(哥们,你还清醒着么?正和周公见面!)

步骤计算

  • 率先把数量整理成id-item式的整治dataframe
  • 然后把dataframe转换成transaction
  • 设定关联规则参数(support、confident等)建立关联规则
  • 以涉嫌规则按某个目的(lift、support等)排序、解析
  • 可视化关联规则

说好的赢一把就睡啊?

数量搜集

数据怎么来的?当然不是腾讯网给的,是爬虫来的。怎么爬的?那篇文章就隐瞒了。

那就再赢一把

标题延伸

  • 还好刚换了一个笔记本,不然无论Python处理多少,如故跑Apriori模型,推测都会卡成狗
  • 那只是一个case study
  • Apriori算法在数据量大的时候统计量也大得可怕,可以设想FP-growth
  • 用R在单机上调包建模的艺术可以在就学时咀嚼一下,但离工业级的建模仍有反差。这几个case体量的数据建模的话,在斯Parker等分布式并行总结平台上跑算法才是正道

故此,此时我们还要加三个非理性(冲动)环节:

关系分析

本来那里照旧用R调包的方法来做涉嫌分析。然而这些数量体量太大了,全量读的话单机内存会爆,更别说Apriori举行全表扫描、逐步迭代总结……所以拔取部分样书即可,那里取100w条数据作为样本来跑模型。

library(readr)
library(arules)
library(arulesViz)
library(dplyr)

topic_info <- read_csv("E:/data/data/zhihu_topics.csv")
Encoding(topic_info$topic) <- "gbk"
user_topic_sample <- read_csv("E:/data/data/zhihu_user_topic_sample.csv")
user_topic_sample <- user_topic_sample %>% left_join(topic_info[,1:2])


trans <- as(split(user_topic_sample$topic,user_topic_sample$user_token),"transactions")
rules <- apriori(trans,parameter = list(supp=0.1,conf=0.5,minlen=2))
summary(rules)
rules.sorted <- sort(rules, by="lift")
inspect(rules.sorted)  %>% head(50)

                    lhs           rhs   support confidence     lift count
[1]  {旅行,美食,心理学} =>     {时尚} 0.1015915  0.7318048 3.065149  3479
[2]         {健身,美食} =>     {时尚} 0.1031099  0.6927604 2.901612  3531
[3]  {电影,旅行,心理学} =>     {时尚} 0.1069937  0.6879459 2.881447  3664
[4]       {美食,心理学} =>     {家居} 0.1003066  0.5069362 2.868005  3435
[5]    {电影,旅行,美食} =>     {时尚} 0.1104687  0.6830986 2.861144  3783
[6]  {电影,美食,心理学} =>     {时尚} 0.1116659  0.6745458 2.825320  3824
[7]       {健身,心理学} =>     {时尚} 0.1055921  0.6569767 2.751733  3616
[8]              {家居} =>     {时尚} 0.1146153  0.6484388 2.715972  3925
[9]       {旅行,心理学} =>     {时尚} 0.1209228  0.6474359 2.711771  4141
[10]        {健身,旅行} =>     {时尚} 0.1037232  0.6473483 2.711404  3552
[11]        {旅行,美食} =>     {时尚} 0.1232005  0.6455018 2.703671  4219
[12]   {电影,旅行,时尚} =>     {美食} 0.1104687  0.8419764 2.689440  3783
[13] {旅行,时尚,心理学} =>     {美食} 0.1015915  0.8401352 2.683559  3479
[14]             {商业} =>     {创业} 0.1386772  0.6043523 2.653679  4749
[15]             {创业} =>     {商业} 0.1386772  0.6089242 2.653679  4749
[16]      {美食,心理学} =>     {时尚} 0.1250986  0.6322314 2.648088  4284
[17]        {美食,设计} =>     {时尚} 0.1017667  0.6320276 2.647234  3485
[18]   {电影,健身,美食} =>     {旅行} 0.1030223  0.8275862 2.635608  3528
[19]        {电影,家居} =>     {美食} 0.1067601  0.8175313 2.611357  3656
[20]        {电影,生活} =>     {音乐} 0.1106731  0.6273796 2.605143  3790
[21]      {设计,心理学} =>     {时尚} 0.1066433  0.6206662 2.599647  3652
[22]      {旅行,心理学} =>     {教育} 0.1022631  0.5475297 2.595536  3502
[23] {电影,时尚,心理学} =>     {美食} 0.1116659  0.8118896 2.593336  3824
[24] {美食,时尚,心理学} =>     {旅行} 0.1015915  0.8120915 2.586262  3479
[25]   {电影,美食,时尚} =>     {旅行} 0.1104687  0.8102377 2.580358  3783
[26] {电影,旅行,心理学} =>     {美食} 0.1241349  0.7981600 2.549481  4251
[27]      {家居,心理学} =>     {美食} 0.1003066  0.7958758 2.542185  3435
[28]           {经济学} =>     {商业} 0.1366915  0.5831568 2.541385  4681
[29]             {商业} =>   {经济学} 0.1366915  0.5956987 2.541385  4681
[30]      {旅行,心理学} => {职业发展} 0.1016791  0.5444028 2.538890  3482
[31]        {旅行,时尚} =>     {美食} 0.1232005  0.7948380 2.538870  4219
[32] {电影,健身,心理学} =>     {美食} 0.1009490  0.7898104 2.522811  3457
[33]      {美食,心理学} =>     {教育} 0.1051248  0.5312869 2.518538  3600
[34]        {电影,商业} =>   {互联网} 0.1016207  0.6815511 2.518041  3480
[35]        {创业,电影} =>   {互联网} 0.1006862  0.6791412 2.509137  3448
[36] {电影,健身,心理学} =>     {旅行} 0.1004818  0.7861549 2.503662  3441
[37]   {电影,健身,旅行} =>     {美食} 0.1030223  0.7826087 2.499807  3528
[38]             {健康} =>     {生活} 0.1190539  0.6937213 2.498579  4077
[39] {电影,设计,心理学} =>     {美食} 0.1091254  0.7806559 2.493570  3737
[40]             {教育} => {职业发展} 0.1122500  0.5321152 2.481586  3844
[41]         {职业发展} =>     {教育} 0.1122500  0.5234918 2.481586  3844
[42] {电影,时尚,心理学} =>     {旅行} 0.1069937  0.7779193 2.477434  3664
[43]        {健身,美食} =>     {旅行} 0.1156373  0.7769276 2.474276  3960
[44]      {美食,心理学} => {职业发展} 0.1046576  0.5289256 2.466711  3584
[45]        {电影,健身} =>     {时尚} 0.1102351  0.5883728 2.464387  3775
[46]      {电影,互联网} =>     {商业} 0.1016207  0.5648434 2.461576  3480
[47]        {设计,时尚} =>     {美食} 0.1017667  0.7699956 2.459519  3485
[48]        {健身,时尚} =>     {旅行} 0.1037232  0.7721739 2.459137  3552
[49]      {电影,互联网} =>     {创业} 0.1006862  0.5596494 2.457391  3448
[50]        {美食,时尚} =>     {旅行} 0.1232005  0.7705936 2.454104  4219

提高度最高的关联规则是{旅行,美食,心境学} => {风尚}
,达到了3倍多!事实上这一个top50的涉嫌规则很多都是导向“时尚”这么些话题,果然不愧为逼乎。

plot(rules, method="graph", control=list(type="items"))

image.png

图就不解释了,一向都不是很懂关联规则可视化图怎么解读……

叠加一下各话题关切人口top100:

虎扑关心人数top100的话题

事关分析的结果可用作推荐系统。与协办过滤算法比较,它不必统计两两相似度的邻接矩阵,计算量相对小一点;而且协同过滤算法只可以总括相似度,关联规则有协助度、置信度、提高度等目的,解释性较强一些。但是在一齐过滤算法中,因为有两两的相似度,因为借使有一个新的input,总能根据最高的相似度举行推荐;而在论及规则中,唯有触及了相应的涉及规则才能推荐,由此它的覆盖面不如一道过滤广。

事实上,你纠结的不是能不可能再赢一把的难点。赢一把,只是你想继续玩,不停地玩的借口。那么些借口,连你自己都不信,还想指望哪个人信?

用在此往日爬的乐乎用户作为数据,跑了一晃Apriori算法,发现了部分有趣的关联规则。以下是简单的剖析进度。

——(哥们,你现在很瘦?已一身肥膘!)

当贪欲已经蒙蔽你的双眼,你也只会用“赢一把再睡”的假话来麻醉自己。当你输了,就想赢;当你赢了,更想赢。输赢无止境,你早就丢了所谓的自律与本分,赢不赢或者赢几把曾经漠不关怀,你要的,只是继续玩,和一个支撑您继承玩的假说,足矣。

如此那般一看,就好像可以把“有一种熬夜,叫赢一把再睡”拆分开来,找找逻辑关系。

玩游戏

成就感是满意了克制强大对手的制伏欲

有一种醉酒,叫喝一盅再停杯;

有好处

——(哥们,你现在想抛?已经被套牢!)

有一种刷微信,叫……没错,就是您,还在刷朋友圈、看微信,快快休息,洗洗睡!

还没赢的人会说:老子还没赢呢,先赢了再说;

——(哥们,你妈喊你回家吃饭!别吵,再让自己睡一会,就一会……)

2、追思大学时期,下自习回寝室打游戏,玩单机打通关,有一关就是过不去。说好了就通一关,这关通了就睡。结果,那关通了,关关都通了,这一夜,没有睡。

无论是您是一向没赢,如故有输有赢,照旧直接在赢,我们都曾经忘了一上马“赢一把就睡”的初衷,而一度陷入了“玩就玩,有输有赢,反正老子不睡了”的泥淖。

文&漫画丨秦淮君

幸福感

有一种肾虚,叫撸一把再睡;

赢一把的人会说:太爽了,百尺竿头更进一步,再赢一把!

按说,那一个逻辑关系到此截至,赢一把后,既满意了玩游戏的欢娱,又满意了打赢的引以自豪。不过难题,也就出在那边——因为理性逻辑是无力回天抑制人类的物欲横流的

挫败感

只要玩游戏的例子并不可以套用到你的阅历中,那么下边的这几个公式,请您对号入座:

——(哥们,你现在获利了没?棺材本都没!)

——(哥们,你现在还足以么?这啥,已萎!)

赢一把

终生打游戏,输了持续打,赢了越来越接轨打,也都稀松平时了,没悟出死党竟然把大家夜猫子打游戏党的表征摸了出去:有一种熬夜,叫赢一把再睡,还真是如此个所以然!

1、澳门美高梅手机网站,忆起高中时代,放个暑假去网吧包夜,分战队打CS,一路输,一路想赢回来。说好了就赢一把,那把赢了就睡。结果,那把赢了,又赢了不少把,这一夜,没有睡。

一旦赢了

首先,大家理清以下重点词:玩游戏,赢一把,和熬夜。然后,我们各类对应紧要词的习性,并对应互相间事关,列表如下。

有一种炒股,叫赚一笔再抛

利益是乐滋滋

有一种发福,叫吃一口再闭嘴;

3、瞅瞅工作之后,下了班回家搞联合,上线LOL撸它一把,结果对方一群小学生像是开了挂。老子怒了,一定要教训下那群小子,打赢一局就睡。结果,教训与被教训觥筹交错,这一夜,又没有睡。

别说那位死党了,我要好都得以出现说法:

即使没有赢

有一种懒散,叫就让我再睡一会。

有成就感

有一种赌博,叫赢一把再quit;

这就必定要赢

那边就不列举4、5、6、7、8了,例子太多,不计其数。我为着赢一把的游乐,囊括了第一人称射击和即时战略游戏等全套:《战争机器》、《大巴2033》、《义务召唤》体系、《荣誉勋章》系列、《帝国时代3》、《极品飞车》种类、《战地》系列、《魔兽争霸》、《英雄联盟》、《英雄连》种类等等等等。玩得游戏不雷同,但结果是如出一辙的:熬夜了,一夜没睡。而熬夜的结果是怎么呢?是第二天的旺盛不振,与毫无作为。

天半夜1点,揉揉熊猫眼,我起先刷最终一次朋友圈:微商、鸡汤、自拍,无非依然这几个东西。正刷着,瞅见死党发了一条说说:“有一种熬夜,叫赢一把再睡”,上面还附上了魔兽世界的游乐截图。这一幕,不以为奇了,那死党一到周末就挖掘宵。无法,何人叫经常工作忙,难得偷上一遍闲。不过死党那句说说,倒是让自身气象一新,那不就是神话中的“有一种XX,叫XX”体么(比如“有一种忙,叫瞎忙!”)?

发表评论

电子邮件地址不会被公开。 必填项已用*标注