基于搜索的短文本分类算法研究-AET

2018-11-30 15:46:30 電子技術應用

0 引言

文本分类(Text Classification)是指在给定的分类体系下，由计算机通过某种分类算法将未知类别的文本进行自动归类的过程。最近十几年，文本分类得到了迅速的发展，并且被广泛应用到许多领域，包括：数字图书馆、网页分类、垃圾电子邮件过滤等。到目前为止，已经有许多基于统计学理论和机器学习的文本分类方法，如决策树（Decision Tree）、贝叶斯方法、KNN、神经网络、支持向量机(SVM)等^[1]。然而，这些分类方法的研究和应用都是基于长文本的，而目前短文本在网络上使用越来越普遍。最近新兴起的微博客的最大的特点就是“微”，一般发布的消息只能是只言片语。著名流量统计网站ALEXA的数据显示，Twitter日均访问量已近2 000万人次，在美国、英国、加拿大等地的网站排名中均列前15位。在专业或者垂直搜索领域，由于资源限制，无法对全文进行处理，转而根据文章标题或文章摘要进行分类。这些应用场合都需要短文本分类技术。针对实际的需求以及传统方法的不足，本文提出了一种新的分类方法，利用搜索实现基于类似NaiveBayes的文本分类方法。对比实验表明，在短文本的分类上，此方法比传统的分类方法提高了准确率和分类速度。

1 相关工作介绍

在过去的四十多年中，许多关于文本分类的研究工作都是围绕着Salton提出的向量空间模型(VSM)展开的，向量空间模型的基本思想是以向量来表示文本：(W₁，W₂，…，W_n)，首先将文本进行分词，由这些词作为向量的维数，用词频来表示特征项对应的向量分量，词频计算方法主要运用TF-IDF公式。对于向量空间法的研究工作主要集中在特征选取和特征权重的调整上来提高分类的性能，如陆玉昌先生在特征选取中利用评估函数代替TF-IDF公式进行权值调整^[2]。

神经网络学习算法在文本分类中的研究和应用也非常广泛，其中最流行的神经网络算法是1986年由RUMELHARD D E和MCCLELLAND J L提出的后向传播算法(简称BP算法)^[3]。由于BP算法存在收敛速度慢、容易陷入局部极小值等问题，后人对BP算法进行了多方面的改进，如李晓峰提出了BP神经网络动态全参数自动调整学习算法^[4]。神经网络拥有很好的对噪音数据的承受能力和文本分类能力，但是需要大量的参数，这些通常主要靠经验确定。另外神经网络需要很长的训练时间，因此它适用于有足够长训练时间的应用。

王建会等提出了基于互依赖和等效半径、简单但高效的分类算法SECTILE^[5]，该方法提出互依赖（Mutual Dependence，MD）模型，并将其与N-gram结合起来进行特征属性选择，提高了属性选择的准确性，实现了有效地降维。引入等效半径(Equivalent Radius，ER)的概念,用基于等效半径的相对距离代替传统的欧氏距离，提高了分类精度。SECTILE分类算法计算复杂度低，分类模型容易更新，适用于大规模信息样本分类场合。

石志伟等提出了向量空间法和k近邻的组合分类方法^[6]，该方法将整个实例空间划分为正实例、负实例和混合实例三部分，根据查询实例落入不同的区域调用不同的分类算法。该方法充分利用了向量空间法分类速度快和k近邻方法分类精度高的优势。

以上提到的各种分类方法都适用于长文本的分类，由于短文本相对于长文本要短得多，文本中的特征数很少，并且文本之间很少含有相同的特征，因此传统的文本分类方法并不适合短文本分类。目前专门研究短文本分类的工作还较少，大致分为两种研究方向：一种是通过外部资源来增加文本之间共享的特征，丰富文本的上下文，例如Wikipedia被作为外部资源引入短文本分类中

^[7]，从而可以使用传统的文本分类方法；另一种是充分利用这些稀疏的特征，对短文本进行预处理。下面介绍一些针对短文本分类的研究工作。

蒲强等提出基于独立分量分析（Independent Component Analysis，ICA）和潜在语义分析（Latent Semantic Analysis，LSA）的短文本分类方法^[8]，该方法首先通过LSA对文本进行预处理，然后对处理结果再进行独立分量分析。LSA利用奇异值分解（Singular Value Decomposition，SVD）降秩方法实现信息抽取和噪声去除，将文档的高维表示投影在低维的潜在语义空间中，从而呈现出潜在的语义结构。然而对原始词——文档矩阵进行SVD，选取最大的一些奇异值对应的特征作为潜在语义空间，目前没有理论证明奇异值最大的那些特征具有最好的分类能力，所以在该潜在语义空间上进行文本分类，分类效果并没有得到改善。

滕少华等提出基于条件随机场（Conditional Random Fields，CRFs）的短文本分类方法^[9]，该方法认为短文本通常集中于一个主题，从而文本中的特征也具有很强的相关性。根据这种性质，该方法利用中文分词中的字标注方法，将短文本分类问题转化成序列标注问题，从而可以使用CRFs来解决短文本分类问题。然而CRFs依赖于高置信度特征，高置信度特征也可以引入干扰，这样就很容易导致分词错误，这种困难很难依靠CRFs自身来解决。虽然可以通过对基于CRFs的分词结果进行后处理来解决该问题，但是这种方法有它的局限性，只能使用基于CRFs的中文分词。

综上所述，目前的短文本分类方法不能有效地选择那些分类能力好的特征，分类准确度低，分类速度慢；或者依赖于中文分词系统，扩展性差。本文提出的基于搜索的Na?觙veBayes文本分类方法在这些方面进行了改进。

2 基于搜索的朴素贝叶斯分类算法

基于搜索的朴素贝叶斯文本分类是将搜索技术应用到文本分类中，并对朴素贝叶斯分类算法进行改进，从而实现的一种适合短文本分类的分类方法。分类算法如下：

令C={c₁，c₂，…，c_m}是预定义的类别集，D={d₁，d₂，…，d_n}是待分类的文档集，d={w₁，w₂，…，w_n}是一个文档的特征向量，文档d_i

属于类别c_j的概率可以由条件概率P(c_j|d_i)表示。根据贝叶斯公式：

式(2)、式(4)中，|c|为文本的类别数，分子上的1是为了防止出现概率为零的情况进行的加权处理。

为了计算简便，不妨在选取训练数据时规定各类别中的文本数一样多。这样，对于每一个文本类别来说，先验概率是相等的，计算P(c_j)的过程也可以忽略不计。计算贝叶斯概率也就简化成了计算文档d_i属于类别c_j的后验概率：

在式(5)中，对于每一类别来说，分母部分N(c_j)+|c|是相等的，即不影响属于每一类别的概率大小比较，这样就直接计算：

而为了防止出现负无穷和零的情况，只需要知道每一个属性(词)在指定类别中出现的文档个数，即N(w_i|c_j)。

结合上面的公式推导，可以将基于搜索的NaiveBayes文本分类算法描述如下：

(1)假定有m个类别C₁

，C₂，…，C_m。分别对每一类别中的数据样本进行中文分词，建立索引C_Index1，C_Index2，…，C_Indexm；

(2)给定一个没有类标号的数据样本X，对其进行中文分词(分词系统要和步骤(1)用到的分词系统保持一致)，每个词对应一个属性，分别为W₁，W₂，…，W_n；

(3)求将数据样本X分配给类别C_j的概率，即：

换言之，X被分配到使P(w|c_i)最大的类别C_i。

注意：步骤(1)也可以看作是建立分类模型，此步不影响分类的速度，因为建立分类模型是在进行文本分类之前做的。基于搜索的NaiveBayes分类器模型是对已知类标号的训练数据集建立的索引，并且各个类别的训练数据文本数是相等的。这也是基于搜索的NaiveBayes分类器和其他分类器的不同之处。为了提高速度，本文使用了Lucene.Net搜索技术。Lucene.Net中自带的StandardAnalyzer分词器是以字为单位索引的，对于中文文本分类来说，按单字分词会影响分类的精度，所以本文使用了KTDictSeg分词系统，KTDictSeg是由KaiToo搜索开发的一款基于字典的开源的中英文分词系统。KTDictSeg可以识别中文人名，还有对Lucene.net 的支持，提供KTDictSegAnalyzer 分析器给Lucene.net。

分类器效率的评估结果可以有多种，比如分类的准确率、速度、可规模性等。而评估的方法也有多种，最简单的是保持(Holdout)方法，即使用类标号已知的数据来测试分类器。在认为分类器的准确率可以接受时，就可以利用此分类器对类标号未知的数据进行分类预测。

3 实验及结果分析

对于中文文本分类而言，目前还没有标准的语料库可供使用。因此，本文使用搜狗实验室整理的语料库(SogouC.reduced.20061127)，此语料库包含了九个类别，分别是财经、IT、健康、体育、旅游、教育、招聘、文化、军事，每一类包含1 990篇文章。对此语料库做一下简单整理，从每一类中随机选出160篇文章作为测试数据，用剩余的1 830篇文章作为训练数据建立分类模型。用准备好的测试数据对基于搜索的NaiveBayes文本分类器和weka的NaiveBayes文本分类器进行测试，测试结果如表1所示。

从表1可以看出，基于搜索的NaiveBayes分类器和weka的NaiveBayes分类器不相上下。但是，为了体现基于搜索的NaiveBayes分类器对于短文本分类的优越性，对这1 440篇测试数据做一下简单处理后再次进行测试，即每一类中包含50字以内的文本50篇、50～200字的文本50篇、200～1 000字的文本50篇和1 000字以上的文本50篇。这样测试数据就按照文本字数的多少分为了不同的等级，并且测试数据文本数也增加到了1 800篇。然后用整理后的测试数据对两种分类器进行测试，测试结果如表2所示。

根据表2的数据绘制出分类准确率的曲线图，如图1所示。

通过图1可以清楚地看到，对于100字以内的短文本的分类，基于搜索的NaiveBayes分类器在分类精度方面表现出了优越的性能。通过表2和表1的比较也不难发现，对于1 440篇长文本的分类，基于搜索的NaiveBayes分类器耗时12.587 5 s；而对于加入了短文本的1 800篇文本的分类，基于搜索的NaiveBayes分类器耗时13.006 2 s。从数字上可以看出，对于短文本的分类，基于搜索的NaiveBayes分类器在分类速度上也明显提高。

这说明基于搜索的NaiveBayes分类方法对短文本的处理得到了很好的分类效果，并且并没有因为选取全部的文本特征而降低分类速度，相反，由于搜索技术的引入，从某种程度上还提高了文本分类的速度。

4 结论

本文针对传统的文本分类方法对短文本分类的不足，提出了基于搜索的NaiveBayes文本分类方法。该方法与传统的文本分类方法的不同之处在于，它将搜索引擎技术应用到了文本分类中，并对朴素贝叶斯分类算法进行了改进。实验结果表明，对于短本文的分类，基于搜索的NaiveBayes分类方法不仅大大提高了分类的准确度，同时降低了时间复杂度。另外，在文本特征提取和中文文本停词的处理方面，针对不同的应用背景还需要做进一步的研究。实验用的语料库不是标准的语料库，仅仅有17 910篇文章，因此，实验的规模有待进一步扩大。在应用前景方面，随着通信技术和互联网的发展，电子邮件、短信、微博信息等各种短文本信息迅速增加，基于搜索的NaiveBayes文本分类器必将会得到广泛的应用。

参考文献

[1] Wu Xindong，KUMAR V，QUINLAN J R，et al.Top 10 algorithms in data mining[J].Knowl.Inf.Syst.，2008(14)：24-27.

[2] 陆玉昌，鲁明羽，李凡，等.向量空间法中单词权重函数的分析和构造[J].计算机研究与发展，2002，39(10)：1205-1210.

[3] RUMELHART D E，MCCLELLAND J L.Parallel distributed processing：explorations in microstructure of cognition，Vol.1：Foundations[M].Cambridge：MIT Press，1986：318-364.

[4] 李晓峰.动态全参数自调整BP神经网络预测模型的建立[J].预测，2001，20(3)：69-71.

[5] 王建会，王洪伟，申展，等.一种实用高效的文本分类算法[J].计算机研究与发展，2005，42(1)：85-93.

[6] 石志伟，刘涛，吴功宜.一种快速高效的文本分类方法[J].计算机工程与应用，2005，41(29)：180-183.

[7] SCHONHOFEN P.Identifying document topics using the Wikipedia category network[C].Proc.the IEEE/WIC/ACM International Conference on Web Intelligence，2006：456-462.

[8] Pu Qiang，Yang Guowei.Short-text classification based on ICA and LSA[C].Berlin：Springer-Verlag Berlin/Heidelberg，2006：265-270.

[9] 滕少华.基于CRFs的中文分词和短文本分类技术[D].北京：清华大学，2009.

作者信息:

康卫1，邱红哲2，焦冬冬1，房志奇1，于寅虎1

(1.华北计算机系统工程研究所，北京100083；2.北京航天飞行控制中心，北京100094）

分享到:

閱讀更多 電子技術應用 的文章

關鍵字: 短文分类电子邮件

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

刚刚:刚刚工作的毕业生，一个月只有2000多，是不是太少了？根据你城市消费水平来看啊，还有你从事的工作，假如你在二三线城市做一份事业单位或者是编制类的工作，薪资水平是随着你工作年限逐年增长的，而且在年终也有很多福利补贴待遇等等，算下来收入也是可观的，再举一个例:-毕业生 2000

为什么只有edg赚钱？

电竞行业作为一个新兴产业，这几年发展势头越来越好，IG战队，FPX战队先后夺得了s8-s9世界赛的冠军，据俱乐部知情人士透露，除了国内的几家豪门俱乐部之外，其他俱乐部基本都是亏钱在做的，当然EDG也是:-edg 赚钱:为什么只有edg赚钱？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

20000:网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？天猫旗舰店，或者淘宝旗舰店，或者京东旗舰店肯定包真，质量好，再说可以官方验证啊，不能图那十块五块的便宜，毕竟一个充电宝要用好久呢，一两年没问题的。:-罗马仕马仕毫安

我们买的新商品房还没有拿到房产证，怎么转卖最好？

没有取得房抄产证的房子可以转让。但如果确定无法取得房产证的，房产转让不受法律保袭护。一般情况下，只有取得房产证的房屋才能确定房屋产权人，才具有转让的条件。但如果房屋是合法取得的，以百后可以依法办理度房:-转卖房产证商品房拿到:我们买的新商品房还没有拿到房产证，怎么转卖最好？

为什么突厥人可以成功复国？是大唐的刀不锋利了么？

锋利突厥人你这样说只能说明你对历史非常不了解，我先用一句话概括突厥被大唐雄兵打的有多惨：三次灭国，背井离乡，远赴西亚，打不过，俺躲着你还不行吗？突厥的意思是中间怂起的头盔。其来历已经不可靠，可能有着匈奴、鲜卑或:-复国大唐:为什么突厥人可以成功复国？是大唐的刀不锋利了么？

小高层16层高楼间距60米哪一层比较好？

小高层 60:小高层16层高楼间距60米哪一层比较好？首先需要明白，选择层数居住与楼间距毫无关系，住在哪一层，肉眼看对面楼的距离，是相差不大的。设定楼间距60米，纯粹是混淆视听。其实，一幢楼的楼层总数确定的情况下，到底哪一层最佳？很简单，取总层数乘以黄金:-楼间距层高

金银花盆栽好养吗？怎么养？

金银花可以盆栽，很好养的！金银花，是忍冬科的常绿缠绕灌木，枝条柔韧修长，多攀爬或匍匐生长。金银花生性强健，在我国的很多南方省份野外很多地区都能看到它的身影，叶子常年翠绿，到夏季开花，飘香四溢。所以，有:-金银花盆栽:金银花盆栽好养吗？怎么养？

长城对于抵御古代匈奴和蒙古人起到了多大作用？

长城真的无用吗？在今天许多人认为长城无用，古代国家举国之力建造的长城不过只是文物，就连康熙都曾作诗讽刺，原文如下：万里经营到海涯，纷纷调发逐浮夸。当时用尽生民力，天下何曾属尔家。-康熙但真的如此吗？小:-匈奴抵御长城:长城对于抵御古代匈奴和蒙古人起到了多大作用？蒙古人

什么树可以嫁接腊梅？

腊梅只能嫁接在不同品种的腊梅上，其他的树种不行！腊梅的繁殖可以用播种，压条，嫁接，分株等繁殖方法。播种法因不易保持花卉的原有优良特性，且播种的优点是在于大量繁殖，而腊梅大都只需培植少量几株，故一般都不:-腊梅嫁接:什么树可以嫁接腊梅？

行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？

堪忧五一假期:行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？事实上，因为教育培训都是预收费用的模式。但凡有一点点规模的培训机构老师。在上半年，带课量是可以得到保证。:-课时量

在农村“立夏节”都有哪些民间习俗？

民间习俗农村:在农村“立夏节”都有哪些民间习俗？在农村“立夏节”都有哪些民间习俗一、农村立夏常见的习俗风俗活动：1、吃鸡蛋“立夏吃蛋”习俗由来已久，俗话说“立夏吃了蛋，夏天不疰夏”。据说立夏开始天气越来越热，村里小孩儿会有身体疲劳四肢无力的感觉，吃:-立夏节

男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？

失望分手看法:男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？你的这个问题特别的有趣，我觉得你先不要看你要怎么做才让他才能让他对你的印象有所改变，你要去看为什么是两个月之后可以在一起，这两个月他会用来做什么，为什么会有这两个月？例如他的身体碰到了什么样的问题吗？:-答应我

工程分包乙方人员伤残谁承担？

承担:工程分包乙方人员伤残谁承担？分包乙方分包致人伤残责任谁承担？严格来说，需要了解更多伤残原因才能区分的，作为非专业人士，自己发表一点浅见供题主参考：1、如果甲方是央企的话，他们合同中的责任、义务等条款内已经将自己的责任全部撇开了，更会:-乙方伤残

有哪些看起来毫不相关的两个历史人物实际上有过联系？

实际上:有哪些看起来毫不相关的两个历史人物实际上有过联系？历史人物联系这个词貌似太宽泛了，就好像有一个调皮的答案说的，胡亥和溥仪相隔2000多年，牵强的找，也有联系：都是亡国之君不是。我想题主的意思是两个看起来应该风马牛不相及的人物，在历史上居然是熟悉或是一个时代的:-毫不相关

13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？

法系车不保值，如果准备常开可以入手，性价比高，价格应该在二至三万之间，二手车一车一况，一况一价，居体价格看车况。:-钱能水泡:13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？世嘉自动挡

22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？

17年驾驶证二手:22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？建议买日系二手车，开顺了卖了，买新车，昂克赛拉无法再次出手时获得好价格，而且也不省油，开完日系车直接换德系:-昂克赛拉

如何骑车去台湾骑行？

骑车在台湾没有回归内地前，最好不要去台湾，一是国内政策不允许你去台湾，因为已停止了台湾个人游。二是你偷着去台湾旅游，安全没有保障，偷渡客在哪里也没有安全保障的。以后内地政策允许个人去台湾旅游了，建议那时再:-骑行台湾:如何骑车去台湾骑行？

本人预算5万左右，想买一辆二手法系车！求推荐？

预算:本人预算5万左右，想买一辆二手法系车！求推荐？ 5万预算5万元左右，想买一辆二手法系车？推荐东风标致老款308车型。1 5万元可以买标致308车况好的，没大事故呢，年限15年左右，公里数3万左右，手动档车型。2 标致308车型，底盘调教扎实，跑高速稳定:-法系二手

14年进口马自达5PK进口10年道奇酷威买哪个划算？

道奇你好，好高兴回答你的问题！14年进口马自达5和10年月道奇酷威个人感觉马自达5比较划算。新车价马5报价29.99万，酷威19.38万两款车都是原装进口，马5属于日系，酷威属于美系。两款车不属于同类车型:-酷威马自达 14年:14年进口马自达5PK进口10年道奇酷威买哪个划算？

2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

特殊津贴高校人才就要重视，河南省高校人才更要重视，这个人才不是评出了的，而是推荐出来的，没有推荐，连参评的资格都没有。国务院特殊津贴人员推荐，不推荐是百分百没希望，推荐了希望就非常，那么是什么是国务院特殊津贴:-河南大学并列 2020年:2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

本田CRV2019款1.5T舒适版油耗高吗？

李老猫说车为你非专业解答各种选车用车问题本田crv定位于一款紧凑级suv产品，主要对飚丰田荣放，日产奇骏，这款车整体市场表现非常突出，2019年全年累计销量为18.44万台，平均月销1.5万以上，其深:-舒适版本田油耗:本田CRV2019款1.5T舒适版油耗高吗？

国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？

1.世界经济遭到重创疫情影响之下，各行各业基本属于停工停产的状态，在世界经济趋于一体化的今天，停工停产势必会造成一系列的连锁反应，最后导致的结果可能会引发金融危机。2.世界格局可能发生改变美国仍是世界:-头脑风暴控制:国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？疫情国外

本田XRV这款车的整体表现怎么样？我想买1.5T自动豪华版，全款多少钱？

如果有15万元的预算，让你选择一台空间和动力都很不错的小型SUV，我觉得很多的读者都会想到本田XRV这款车型。因为本田XRV确实太出色了，和同级别的其他盒子SUV车型相比，这款车在空间和动力上都有优势:-xrv 自动:本田XRV这款车的整体表现怎么样？我想买1.5T自动豪华版，全款多少钱？本田豪华版

现在存款有14万，借了5万还没收回来，该做什么好？

何去何从:现在存款有14万，借了5万还没收回来，该做什么好？续租存款利息率较低，可以投资较高收益的项目，比如投资基金，一般情况下可获得6%一10%的回报。如果行情好可达到50%以上收益，去年不少基金超过这目标。目前受疫情影响，股市在低位震荡，也是基金投资的机会。一:-存款 2300

2070super和5700xt买哪个比较好？

如果是玩游戏毫无疑问选择n卡，也就是2070 suep。如果追求性价比可以选择a卡，也就是5700xt. 为什么游戏选n卡呢？首先游戏厂商针对n卡优化比较多，然后就是功耗小，然后N卡架构执行效率极高，:-:2070super和5700xt买哪个比较好？

生完二胎后，感觉自己有点抑郁，总是想发火，特别烦躁，怎么办？

二胎我是两个孩子的妈妈，曾经的我和你一样，生完宝宝我也抑郁了，我知道抑郁症真的很痛苦，产后的那段日子我整天都不开心，做什么事也没积极性，谁也不想搭理，别人给我说话我就觉得很烦。忍不住冲家人发脾气。每当一个:-生完抑郁:生完二胎后，感觉自己有点抑郁，总是想发火，特别烦躁，怎么办？发火

人这一生遇到的人和事为什么感觉都像是必然的经历？

感觉:人这一生遇到的人和事为什么感觉都像是必然的经历？正所谓有因必有果，所以你今天的因，就会产生明天的果。所以这一切你就会觉得是必然的。生活中大部分是普通人大家的生活规律，生活方式，大致相同。当你看到别人家庭的果，自己家也产生同样的果，你就会觉得这一切是:-人和经历

现在校内校外到底教的是美式英语还是英式英语还是混搭英语？

校内:现在校内校外到底教的是美式英语还是英式英语还是混搭英语？校外英式答案肯定是不唯一的！美式英语现在是主流，少量英式发音也个别存在！但对于孩子来说，肯定是混搭英语，因为孩子肯定不是一直一位老师教下去，肯定会换老师！而老师的发音肯定是既有英式的，也有美式的！就连一些英语:-美式英语

上有老下有小，我们真的跳不出这个人生循环了吗？

上有老魔咒:上有老下有小，我们真的跳不出这个人生循环了吗？的确如此，尽管现在不结婚，晚婚的人很多，但是从人类繁洐生息的历史和大多数人来看，成家立业，生儿育女，家庭仍是主流，一个人的生理，心理和生存需求決定了生存状态，生儿育女，瞻养父母即是义务责任，也是生活动:-下有小

如果外面正在下小雨，你会突然想起了谁？

想起:如果外面正在下小雨，你会突然想起了谁？我最不忘，还是秋日的雨夜，天又凉了几分，已经需要披上一件薄薄的外套了。临窗而望，眼见窗台上的几株小植物，叶片上沾了几滴小雨珠，我总喜欢，用小手电去照它们，这样的小水滴看起来晶莹晶莹的，有一种清清凉凉的:-小雨

初中同学许久未见大学期间突然联系请吃饭，态度还良好，我给推了，会不会让人很烦？

初中同学:初中同学许久未见大学期间突然联系请吃饭，态度还良好，我给推了，会不会让人很烦？吃饭许久未见，意思就是交情不怎么样，无功不受禄，人家凭什么那么热情，难道真的是多年一来忘不了咱们之间的同学情谊，倍感想念了吗，不是请帮忙、做业务、就是借钱，十有八九十借钱。我建议还是不要去的好，大家都很忙:-许久未见

现在我觉得认真对某个人说我喜欢你什么的这种话好恶心，我爱你更说不出口，好恶心，是什么心理？

出口心理:现在我觉得认真对某个人说我喜欢你什么的这种话好恶心，我爱你更说不出口，好恶心，是什么心理？爱你更多的是心里问题，可能对方还没有优秀到你满意的程度，更没有到那种离不开的地步！爱情最终还是要回归生活，而生活离不开两个人的相处，父母终究会老，孩子终究会飞，所以选择自己的伴侣尤为重要，你现在觉得恶心更:-喜欢你

剧版的《何以笙箫默》和《再见王沥川》哪一个更好看呢？

再见王沥川好看:剧版的《何以笙箫默》和《再见王沥川》哪一个更好看呢？《遇见王沥川》吧，高以翔的王沥川太招人稀罕了。长相，身材，家世，人品，才能样样好，简直完美，挑不出任何毛病，实在要说一个缺点的话，那就是太tm完美，天妒英才、才让他饱受病魔折磨。偶像剧、深情帅气的男主:-何以笙箫默

计算机专业本科能够进入字节跳动、华为这些公司做开发吗？是否还需要继续读研？

学历是求职必备条件。有了工作不能停止对知识的探索。更高的学历，可以让你有更专业的技术能力和学习能力，可以让你拓展自己的交际圈，可以让你更知名。总之，活到老，学到老，学习对人总是有好处的，技多不压身嘛！:-字节跳动:计算机专业本科能够进入字节跳动、华为这些公司做开发吗？是否还需要继续读研？读研计算机专业

生完二胎的你们，现在有什么感想？

二胎家庭日常是什么样的？是不是觉得家里多了一个小人儿，温馨多了？不存在的！生二胎根本是妈妈们的渡劫磨砺！以前周末睡到自然醒，现在全年无休，时刻警醒着，能睡一次懒觉跟过年似的，黑眼圈不说，头发呼啦啦地掉:-生完二胎感想:生完二胎的你们，现在有什么感想？

华北适合种植蚕豆吗？

华北适合种植蚕豆，种蚕豆的面积大，在西北，华北，都在种植蚕豆，蚕豆茎秆根部有根瘤菌是种植其它农作物的好茬地，特别是土壤培养和防病虫害起到作用。:-蚕豆种植适合:华北适合种植蚕豆吗？华北

华为手机更新EMUI10.1系统后效果咋样？

大家知道现在智能手机的性能不仅仅跟智能手机的硬件有关，还跟智能手机的系统软件息息相关，在国产智能手机操作系统里，小米的MIUI系统跟华为的EMUI系统都是比较优秀的操作系统。最近小米推出了小米MIUI:-咋样华为华为手机更新:华为手机更新EMUI10.1系统后效果咋样？

大热天蜜蜂老是爬到箱外结群正常吗？

蜜蜂爬到:大热天蜜蜂老是爬到箱外结群正常吗？盗蜂现在正是夏季，很多地方蜜源稀少，蜂群中可能缺蜜，也是胡蜂猖獗的时间，所以蜂群中是非常容易发生盗蜂的。在蜂群中发生盗蜂的时候，蜂群守卫蜂会增多，但是这种情况引发的蜜蜂在蜂箱外一般不会结团，只是蜜蜂来:-大热天

辣椒正是生长最佳期，偏偏有的辣椒苗蔫，不是病虫害是咋回事？

最佳期雾都山客来回答您的问题。最近山客家乡的村民正在进行辣椒移栽，确实有像题主提到的情形，辣椒苗移栽前长势葱葱，嫩绿喜人，但是移栽后几天内就出现萎蔫现象，细心观察也不是被病虫害危害。那究竟是什么原因导致辣椒:-苗蔫辣椒咋回事:辣椒正是生长最佳期，偏偏有的辣椒苗蔫，不是病虫害是咋回事？

手机相机发展的最终形态会是怎样的？

最近这几年手机在电子产品行业里可谓是发展速度非常快，苹果和华为两大公司可以说也是，明争暗斗，产品一次比一次有卖点，前一段时间华为和苹果还都推出了手机新品，两家都在大力宣传强调着拍照功能，像iPhone:-形态相机手机最终:手机相机发展的最终形态会是怎样的？

华为为什么不出一款5寸全面屏手机呢？我想应该会有很多人支持吧？

5寸手机支持:华为为什么不出一款5寸全面屏手机呢？我想应该会有很多人支持吧？很高兴回答你的问题，刷头条刷出来的问题，看到很多人回答，感觉还有一些观点没有写出，所以我来回答一下。首先，华为为什么不出小尺寸全面屏手机？其实并不只有华为一家没有出小屏手机，放眼近期各大手机厂商发布的:-华为

生吃山芋，生吃胡萝卜，还有哪些蔬菜可以生吃呢？

胡萝卜蔬菜:生吃山芋，生吃胡萝卜，还有哪些蔬菜可以生吃呢？第一种，黄瓜。这个瓜，可不是菜市场中堆放满满的青瓜。各位可要睁大眼睛看清楚了，这个黄瓜，青中带黄，品种属以前乡下农户少量种植的，形态上面来看这种瓜矮、短、圆，表面覆盖有比较淡的细毛，经水轻轻冲洗之后整:-山芋

为什么马铃薯不宜过早过迟播种？

不宜:为什么马铃薯不宜过早过迟播种？播种过早为什么马铃薯不宜过早过迟播种？马铃薯的种植主要是由于气候条件的限制，过早出苗后容易遇到低温被冻死，种植晚了容易遇到干旱和高温，影响产量。马铃薯种植时间的早晚必须根据种植地方的气候条件来确定。马铃薯生长:-马铃薯

疫情愈发严重，原油为何反而大涨？

原油愈发:疫情愈发严重，原油为何反而大涨？疫情愈发严重和原油大涨没有必然关系。但是资金总是从高处流向低处，原油价格跌的越多，投资价值越明显，相对于其他产业更有投资价值。举个例子：深圳南山房价均价大约6万左右，宝安均价5万左右，如果南山房价涨到:-疫情

生菜球很好吃，怎么种植才能高产呢？

种植:生菜球很好吃，怎么种植才能高产呢？高产对环境条件的要求、1.温度生菜球为喜冷凉、忌高温作物，种子在4度以上可发芽、以15～20度为发芽适温。幼苗能耐较低温度，日平均温度12度时生长壮健，叶球生长最适温度为13～16度。不过目前有些结球生菜:-生菜

装修高手来帮忙看下144平，套内122平，怎么三房改四房？？

看下这个户型三房改四房，改一个小房间，应该没有问题。△原户型图这个户型改四房，能改的方案比较多，但是修改以后是否好用，是一件值得考虑的事情。一、主卧室变为两个卧室可以将主卧室改为两个卧室，但是这样的改动占:-房改 122:装修高手来帮忙看下144平，套内122平，怎么三房改四房？？ 144

大家帮忙看看这个房子如果要砸墙的话，怎么改比较好？

房子:大家帮忙看看这个房子如果要砸墙的话，怎么改比较好？这个户型砸墙，当然可以砸墙，但是在砸墙之前，要搞清楚为什么要砸墙，砸墙以后有什么优劣。△原户型原户型图上的白色墙体部分不是承重墙，理论上说否可以砸掉。但是外墙和与旁边户型或者是公共区域的共用墙体和图上:-帮忙

意蜂夏季喝什么水降温？

降温意蜂夏季喝什么水降温？气温高，蜂巢温度高的情况下，蜜蜂是通过采水的办法挂在蜂箱的四壁来蒸发带走热量，降低蜂巢温度同时也能帮助蜂群维持正常的湿度。在平常的情况下，蜜蜂是在室外采自然水的。夏季消耗的水量:-意蜂夏季:意蜂夏季喝什么水降温？

黄瓜种子催芽后种植需要打底水吗？

黄瓜种子:黄瓜种子催芽后种植需要打底水吗？你好很高兴回答这个问题。答案：不用。1-2天可出芽。黄瓜种子催芽：选用饱满的种子，用30℃水浸泡4小时后催芽。也可用100倍福尔马林溶液浸泡种子10-20分钟，洗净后清水浸种3-4小时，然后于25-3:-催芽黄瓜打底

书友们展示一下自我感觉发挥较好的作品，一起学习？

自我较好这幅作品是参赛的，色彩的搭配，纸张的拼接都是自己设计完成的，一如既往的清新淡雅感觉。书体用的魏碑中楷书，增加了书写的趣味性。:-书友展示:书友们展示一下自我感觉发挥较好的作品，一起学习？

基于搜索的短文本分类算法研究-AET

相關文章:

刚刚工作的毕业生，一个月只有2000多，是不是太少了？

为什么只有edg赚钱？

网上罗马仕充电宝20000毫安的，参数怎么很多样？哪个是真的？

我们买的新商品房还没有拿到房产证，怎么转卖最好？

为什么突厥人可以成功复国？是大唐的刀不锋利了么？

小高层16层高楼间距60米哪一层比较好？

金银花盆栽好养吗？怎么养？

长城对于抵御古代匈奴和蒙古人起到了多大作用？

什么树可以嫁接腊梅？

行情堪忧，还有多少教育机构的老师们五一假期有课上的？课时量多不多？

在农村“立夏节”都有哪些民间习俗？

男朋友失望分手，但对我还有感觉，答应我两个月之后可以在一起，我应该怎么做，才能改变之前他对我的看法？

工程分包乙方人员伤残谁承担？

有哪些看起来毫不相关的两个历史人物实际上有过联系？

13年雪铁龙世嘉自动挡7万多公里，没有水泡事故，多少钱能买？

22+吃土少女17年就有驾驶证了，今年才开始开车，想买个二手昂克赛拉，或者有什么好建议吗？

如何骑车去台湾骑行？

本人预算5万左右，想买一辆二手法系车！求推荐？

14年进口马自达5PK进口10年道奇酷威买哪个划算？

2020年，河南教育行业国务院特殊津贴推荐，河南大学并列第三，大家怎么看？

本田CRV2019款1.5T舒适版油耗高吗？

国外疫情如果没有得到有效控制，世界会发生什么事情？头脑风暴？

本田XRV这款车的整体表现怎么样？我想买1.5T自动豪华版，全款多少钱？

现在存款有14万，借了5万还没收回来，该做什么好？

2070super和5700xt买哪个比较好？

生完二胎后，感觉自己有点抑郁，总是想发火，特别烦躁，怎么办？

人这一生遇到的人和事为什么感觉都像是必然的经历？

现在校内校外到底教的是美式英语还是英式英语还是混搭英语？

上有老下有小，我们真的跳不出这个人生循环了吗？

如果外面正在下小雨，你会突然想起了谁？

初中同学许久未见大学期间突然联系请吃饭，态度还良好，我给推了，会不会让人很烦？

现在我觉得认真对某个人说我喜欢你什么的这种话好恶心，我爱你更说不出口，好恶心，是什么心理？

剧版的《何以笙箫默》和《再见王沥川》哪一个更好看呢？

计算机专业本科能够进入字节跳动、华为这些公司做开发吗？是否还需要继续读研？

生完二胎的你们，现在有什么感想？

华北适合种植蚕豆吗？

华为手机更新EMUI10.1系统后效果咋样？

大热天蜜蜂老是爬到箱外结群正常吗？

辣椒正是生长最佳期，偏偏有的辣椒苗蔫，不是病虫害是咋回事？

手机相机发展的最终形态会是怎样的？

华为为什么不出一款5寸全面屏手机呢？我想应该会有很多人支持吧？

生吃山芋，生吃胡萝卜，还有哪些蔬菜可以生吃呢？

为什么马铃薯不宜过早过迟播种？

疫情愈发严重，原油为何反而大涨？

生菜球很好吃，怎么种植才能高产呢？

装修高手来帮忙看下144平，套内122平，怎么三房改四房？ ？

大家帮忙看看这个房子如果要砸墙的话，怎么改比较好？

意蜂夏季喝什么水降温？

黄瓜种子催芽后种植需要打底水吗？

书友们展示一下自我感觉发挥较好的作品，一起学习？

DNF有人说玩到最后，就是一个拼钱的过程，是真的吗？那为什么还有人玩？

DNF玩家强化13苍穹武器，花费9000块RMB喜提二把+7神器，95版本强化成功率这么低吗？

DNF鸟背手动团比飞机团仅贵40W，却无人申请，现在玩家都不愿意坐手动团了吗？

包拯为何含泪斩公孙策？

hero久龙开创性的把“宗师流”李白带上KPL，这是依靠普攻打伤害吗？路人局能否借鉴？

一年级孩子平时作业都能完成，周日家长布置的额外作业就是不做，厌学了，怎么办？

我女生，本科毕业当教师，想和一个高中没毕业的男生在一起，但男生怕配不上我，怕给不了我好的生活，怎么办？

大家谈谈读大学交了几个朋友，又怎么分手了呢？

本人女94，考上了19年研究生（要读2年），但是感觉自己年龄大了，纠结要不要去读？

lol里为什么辅助一直跟着ad，为什么不像王者荣耀那样一跟着打野去抓人呢？

21岁女孩考了大专卫校，读还是不读好，毕业24岁去哪里找合适男朋友？

绝地求生PCL决赛，4AM遗憾拿到亚军，永远17杀拿下战神位，4AM表现你满意吗？

王者荣耀最喜欢用大招清线的几个英雄，王昭君仅排第二，第一不是法师，你觉得怎么样？

大学恋爱能走到最后的几率到底有多大呢？

妈妈肺癌晚期，医生说只剩不到两个月的时间，自己接受不了这个事情，现在该怎么办？

生活中有的人得严重疾病，被医生认定寿命很短，为什么几年后仍然在很好的活着？

为什么得了癌症的人感觉身边工作的人都远离他，是人性的本能还是对死亡的恐惧？

癌症患者治疗结束后还能回归到原来的正常生活吗？

有没有一句话的鬼故事可以分享？

你觉得刘德华、郭富城、黎明相比，谁出演的烂片最多？

你心目中最经典的十首粤语歌曲有哪些？

如果利物浦本赛季拿到欧冠和欧联双亚王，该怎么评价主帅克洛普？还会下课吗？

为何曼城夺冠这么轰动？巴萨，尤文，巴黎夺冠却很冷清？

不孝有三，无后为大，另外两个是啥？

让你汗毛倒立的灵异故事有哪些？

学医的人会相信鬼怪吗？

你经历过最让你毛骨悚然的事情是什么？或者说听说过什么诡异事件？

妈妈给我带2个小孩，一个3岁一个5岁，每个月我给她400块生活费多不多？

装修高手来帮忙看下144平，套内122平，怎么三房改四房？？