機器學習在選股中應用（Machine Learning for Stock Selection）

2019-11-25 22:42:15 薛定諤的七

標題：Machine Learning for Stock Selection

作者：Keywan Christian Rasekhschaffe and Robert C. Jones, CFA

特此說明：文章僅代表作者本人觀點，不應被視為投資建議，所述觀點也不一定代表CFA Institute和作者本人所在公司的看法。原文發自Financial Analysts Journal Volume 75, 2019 - Issue 3，本翻譯未獲CFA Institute及原作者授權，僅為學習參考之目的，請勿以任何形式進行轉載。

信息披露：

Keywan Christian Rasekhschaffe是美國紐約Gresham Investment Management, LLC的高級量化策略師，Robert C. Jones, CFA，是美國新澤西州Summit System Two Advisors, LP 的董事會主席和首席投資官。

作者報告無利益衝突。

開放獲取：

無

綜述：

在量化金融領域，機器學習已經成為越來越重要和有爭議性的話題。關於機器學習技術能否成為實用的投資工具，仍然存在激烈的爭論。儘管機器學習算法可以發現微妙的，固有的和非線性的關係，但是當研究者試圖從嘈雜的歷史數據中提取信號時，會面對過度擬合的重大挑戰。我們描述了機器學習的一些基本概念，並提供了一個簡單的示例，來說明投資者如何利用機器學習技術來預測股票收益的截面，並儘可能限制過度擬合的影響。

自2008年經濟危機以來，使用量化因子的從業者一直在舉步維艱，很多傳統的因子已經不再有利可圖。結果導致一些從業者試圖尋找超越傳統量化的選股方法。隨著流行的量化因子變得越來越不可靠，很多從業者在開發可以動態的從歷史數據中"學習"的模型。但是，動態模型和特定因素定時方法面對一些有效性的批評(例如，Asness 2016)。多年來，投資者一直在使用諸如迴歸分析之類的計量經濟學技術，但很少有純粹基於這些技術的動態模型獲得了成功。原因可能是財務數據本身就有噪音，這些因子可能是多重共線性的，還有就是因子和回報之間的關係可能是動態的，非線性的和/或上下文相關的。這些特徵使得線性迴歸模型很難估計潛在預測因子和預期收益之間的任何動態關係。

我們相信機器學習算法（MLAs）可以提供比線性模型更好的方法。這些技術已經存在很長的一段時間了。實際上，Frank Rosenblatt在1957年就發明了感知器，一種可以對圖像進行分類的神經網絡。在隨後的幾十年裡，一系列的發展使得機器學習和功能的實用性得以提高：

· 自1970年代以來，計算能力的增長大致符合摩爾定律；

· 數據可用性呈指數級增長，儲存成本也顯著下降；

· 來自諸如計算機科學和統計學的新技術，連同計算能力和數據可用性的提高，催生了強大的新算法。

在金融以外的許多領域，機器學習算法已經被證明比傳統統計技術更加有效。諸如語音識別（如Siri和Alexa的應用），圖像識別（如自動駕駛）和推薦引擎（如亞馬遜的應用）。深度學習算法在許多圖像分類任務中已經超越了人類的準確性。在1997年，一個名為深藍（Deep Blue）的MLA首次擊敗了當時的國際象棋冠軍Garry Kasparov。

它通過高速計算來"蠻力"評估數以千計的可能走法和對抗走法。最近，一個名為（阿爾法零）AlphaZero的深度學習神經網絡使用模式識別技術成為了國際象棋世界冠軍。和深藍被編程以評估不同位置價值的方法不同，它並沒有被給予任何領域的既定知識，它只是在和自己的對弈中自學成才，在短短4個小時內就成為了國際象棋大師。

什麼是機器學習？

機器學習是一系列方法和算法的總稱，它允許機器在沒有顯性編程指令的情況下自行發現模式。在選股的案例中，建模者提供了可能有助於預測未來回報的各種因子，並使用MLAs來學習哪些因素是重要的，以及他們如何與未來回報相關。機器學習提供了一種自然的方法，將許許多多的弱信息源整合成一個比任何來源都強的複合投資信號。

近年來，計算機科學家和統計學家開發並精進了幾種機器學習算法，例如梯度增強迴歸樹，人工神經網絡，隨機森林和支持向量機（定義參加附錄A）。這些算法大多有兩個重要的性質：

1. 它們可以發現複雜的模式和隱蔽的相關性，包括非線性和上下文關係，這些關係通常很難甚至不可能用線性算法檢測到。

2. 在存在多重共線性的情況下，它們通常比線性迴歸更加有效。

雖然關於機器學習技術在金融領域的應用研究比較活躍，但是該領域的許多論文都是側重於某個特定算法的應用。Wang and Luo(2012)提供了使用AdaBoost算法預測股票收益的詳細概述。Batres-Estrada(2015)和Takeuchi and Lee(2013)探索了利用深度學習來預測金融時間序列的方法。Moritz and Zimmerman(2016)使用樹基模型來預測投資組合的收益。Wang and Luo(2014)證明了不同的訓練窗口的組合預測是有效的。Heaton, Polson and Witte(2017)討論了深度學習模型在智能索引中的應用。Alberg and Lipton(2017)提出預測公司基本面（如收益或銷售）而不是回報（因為在預測基本面時信噪比更高），這使得他們可以使用複雜的機器學習模型。

一些文章研究了將非線性模型用於時間因子迴歸的好處。Miller, Ooi, Li, and Giamouridis (2013) and Miller, Li, Zhou, and Giamouridis (2015) 發現了在預測因子回報的時候，分類樹模型比線性迴歸模型更加有效。他們還提出證據表明綜合了線性和非線性的模型甚至更有效。此外，他們證明了包含這些因子預測的截面模型可以表現的比靜態因子模型更好。我們在這項研究中得出了相似的結論，但我們使用了不同的方法。不同於明確的預測單變量多空因素投資組合的收益，我們使用了截面因子分數（特徵）來預測收益的截面。

Gu, Kelly, and Xiu (2018)檢驗了機器學習技術在資產定價方面的有效性問題。作者使用了大量的公司特徵和宏觀變量來預測個股的收益。由於他們使用了總收益而不是超額收益作為因變量，他們合併預測了預期回報和股權溢價的截面。他們檢驗了各種機器學習方法的表現，發現和普通最小二乘迴歸（OLS）相比，非線性預測方法顯著提升了精度。他們將這一進步歸因於機器學習發現非線性模式的能力，以及它們對多線性預測器的魯棒性（抗干擾性）。儘管我們的結論是相似的，我們只關注了與股票風險溢價無關的超額回報截面。因此，我們只使用了個股特性並排除了宏觀變量。我們相信這種方法可以減少噪音和過度擬合的風險。與Gu et al. (2018)一致，我們發現許多機器學習算法的性能優於線性迴歸，但是相對於單個算法的性能，我們更關注與將不同算法和訓練窗口相結合的好處。我們發現，預測組合的表現優於美國和其他地區的成分股。

過度擬合的危險

當模型選擇了噪音而不是信號時，過度擬合就會發生。過度擬合模型有很好的樣本內表現，但面對樣本外數據的時候預測性就很差了。雖然機器學習技術能夠揭示歷史數據中的微妙模式，但過度擬合始終是一個重要挑戰。當一個人在訓練某種算法的時候，在數據中發現模式和能夠適用於樣本外同樣重要。因子和回報之間的關係通常是嘈雜的，有很多潛在的因素存在，這增加了問題的維度。相比之下，很多應用了機器學習的其他領域，例如圖像識別，具備很高的信噪比。例如，一些圖像分類任務（例如對貓和狗進行分類）的錯誤率低於1%。

由於用於預測股票回報的信噪比較低，避免過度擬合顯得尤為重要。圖1展示了使用模擬噪音數據的梯度增強迴歸樹分類器的樣本內和樣本外錯誤率。樣本內的錯誤率總是低於樣本外的錯誤率。隨著助推迭代次數的增加，誤差在樣本內通常不斷減少，

在大約400次的助推迭代之後，誤差變得可以忽略不計。而與之鮮明對比的是，保持樣本的錯誤率先是下降，在大約50次迭代之後反而會上升。這就是算法開始過度擬合數據的地方。

注：使用模擬噪音數據。注意x軸上的更多迭代允許算法更好的適應過去的數據。

與預測股票收益相比，模擬樣本具有較高的信噪比。由於信噪比較低，樣本外結果的偏離速度要比樣本內快得多。

然而，這個樣本說明了基於訓練集評估預測表現的風險：過度擬合使得結果看起來比實際應用上要好得多。接下來，我們將探討兩種可以幫助減輕過度擬合風險的方法：預測組合（forecast combination）和特徵工程（feature engineering）。

預測組合 Forecast Combinations

許多成功的機器學習算法是依賴於bagging（如隨機森林）或boost（如AdaBoost）的集成算法。這些集合算法從許許多多弱學習者那裡獲得許多預測，並將這些預測集合起來生成一個強學習者。Dropout（見附錄A和Srivastava and Hinton 2014）是一個與這些集成算法相關的工具，用於防止神經網絡中的過度擬合，也納入了模型平均的概念。我們相信，通過將不同類型算法的預測綜合起來，並在不同的數據子集上訓練它們，就可以實現更大的多樣性。如果在很多訓練子集上訓練的很多不同算法都能夠找到相似的模式並得出相似的結論，我們就可以更加確信預測是強健的，而不是過度擬合的結果。

預測組合的有效性在統計文獻中有廣泛的記錄。Clemen(1989)早在1989年就總結了關於預測組合的實證證據：

結果幾乎是一致的：將多個預測綜合起來，能夠提高預測的準確性……在許多情況下，人們可以簡單的通過對預測結果取均值來獲得顯著的性能改進。

Makridakis and Hibon(2000)在一項對3003個時間序列進行預測的競爭中進行了分析，結果表明，綜合預測組合通常優於成分預測，甚至比最高的成分預測還要好。Timmermann(2006)提供了一個分析框架來確定什麼時候綜合預測組合可能會更有效，即，當不同的預測者使用不同的數據或技術時，預測的偏誤相關性較低。在這些情形下，綜合預測可以提供更高的信息和更少的噪音。

當然，傳統的多因素模型已經包含了多種預測，因為不同的因子代表了不同的預測。但是，在這裡建議的方法是，通過包含許多不同的預測技術，訓練子集和多重因子，可以進一步提升這一概念。

我們可以在以下幾個方面提升預測的多樣性。

綜合不同類型算法的預測。很多機器學習算法，特別是集成算法（例如隨機序列）——已經用於綜合預測以獲得比單個算法更好的結果。通過集合不同類型的算法，我們應當能夠檢測出特徵和標籤之間不同類型的關係。

綜合不同訓練窗口的預測。不同窗口的預測可以反映不同的市場狀況，並且相關性通常較低。窗口可以在時間，季節或條件的基礎上自定義。結合來自不同訓練窗口的綜合預測也可以降低預測方差，並潛在的增加了風險調整後的收益。

綜合不同因子庫的預測。通過將一個大的因子庫劃分為多個子集，算法可以更好的探索更多的模式，這有可能帶來新的見解。

綜合不同期限的預測。分辨不同期限內的不同因子是很重要的。例如，基本面因子通常對長期投資更為重要，而技術面因子通常對短期投資更具預測性。

特徵工程 Feature Engineering

特徵工程使用領域知識來構造問題，以便可以使用機器學習解決方案。這些工程需要大量的專業知識，可能既困難又耗時，但是對開發強健（魯棒）的預測至關重要。特徵工程決定了我們最終需要算法來解決哪些問題，以及我們使用哪些算法來解決這些問題。這是克服過度擬合的最有效方法之一，因為它允許我們在訓練算法之前就提高信噪比。

特徵公式是領域知識流入流程的地方。在選股方面，它可以決定這樣的問題：我們試圖預測什麼？哪種算法可能是最有效的？哪些訓練窗口更有幫助？我們應當如何標準化要素因子和回報？以及哪些要素因子可能提供有價值的信息？

在接下來的材料中，我們會簡略的討論其中一些問題。目的是提供一個概述，而非全面的討論。這些決策之間可能存在的差異，就像金融建模者的專業知識和想象力的距離一樣大。然而，最終努力是否成功還是取決於決策的質量。

我們在預測什麼？為了限制過度擬合的風險，通常最好的方法就是使用機器學習算法來預測離散變量。相對於線性迴歸預測回報，MLAs通常預測的是具體類別——較好表現者和較差表現者之間的差異，這個相對回報來說沒那麼嘈雜。用戶可能希望選擇其他類別，例如市場表現，或者更多的類別來反映不同水平的表現，但是每增加一個新的類別都會增加過度擬合的風險，並可能只能提高一點點準確性，就像股票回報這類嘈雜的數據一樣。

在選擇類別之後，第二個決策就是如何定義這些類別。如果我們的回報的截面感興趣，我們可以通過在訓練集的每個日期將股票分為表現較好者和表現較差者來定義類別。我們也可以在部門或行業內部定義這些類別以減少噪音。以類似方式進行標準化因子（即特徵）通常是可取的。大多數投資者都希望能夠超越淨風險，所以很自然的，可以將風險調整的超額收益定義為表現類別。這些類別可能包含簡單的波動調整回報或適當風險模型中的阿爾法，例如資本定價模型（CAPM），Carhart(1997)四因素模型、Fama and French(2017)五因素模型，或Morozov、Wang and Borda(2012)中描述的MSCI-Barra模型。利用風險調整後的回報率可以提高信噪比，從而提高對時間和市場領域的預測。

第三個決策涉及預測的期限。選擇預測的期限意味著對這個期限進行優化。短期限適用於低容量，高週轉的策略，長期限則更適合高容量，低週轉的策略。短期限提供了更多的訓練週期，這有助於在嘈雜的數據中發現微妙的模式。預測期限還應當反映潛在數據（或因子）的頻率，一個適當的預測週期從一天到一個季度不等。

我們應當使用哪種算法？維基百科列出了100多種機器學習方法，並且還在不斷的增加中。機器學習是一個快速發展的領域，討論那麼多種算法的優缺點遠遠超出了本文的範圍。但是，通常來說，我們希望我們最終的預測當中包含了使用各種技術的各種算法。事先是不可能知道回報和特徵之間的確切關係的。將來自不同類別算法的預測組合在一起，可以有效防止錯誤設定。這在處理金融數據的時候尤為關鍵，因為在這類數據當中，信噪比很低，而且很難用經驗高度確定它們之間的關係。

集成方法在金融數據和其他領域的應用當中展現出良好的前景。其目標是使用等權重預測(bagging)或準確權重預測(boosting)，將較弱的學習者綜合起來，從而產生一個強的學習者。強學習者往往比其組成部分的任何弱學習者表現的都要好。Boosting和bagging都可以解決監督學習所會遇到偏差和方差權衡的問題。偏差來自於估算方法不能有效捕獲數據中的基本面關係（欠擬合）。方差則是由於訓練集的微小變化導致的誤差，這意味著估計者沒有學習樣本以外的關係（過擬合）。

引導聚合(bagging)在訓練集的隨機子集上獨立的適用於估算器，例如決策樹（弱學習者）。每個弱學習者都是過度擬合的，但是當弱學習者被綜合成一個強學習者的時候，過度擬合產生的錯誤會降低。依序進行強化訓練，使得估計量適合訓練集，並在後續的強化訓練中對錯誤分類的結果予以更大的權重（參見Schapire 1990）。強學習者是弱學習者精確的加權平均。通過給予更成功的學習者以更大的權重，boosting算法可以消除偏誤。如果我們允許boosting算法過於激進的提高成功學習者的權重，這種好處就會被隨之不斷增加的方差所抵消掉。因為這種權衡的存在，boosting算法往往會比bagging算法需要更多更仔細的參數調整，並且保守的學習率更適合於樣本外的股票選擇。大部分boosting算法的訓練時間比bagging算法要長，因為它們必須按照順序運行，而bagging算法可以並行運行。

Boosting和bagging都可以集成不同的基本算法作為它們的弱學習者。不同的算法可以捕獲不同的數據特徵。一些算法比較簡單和線性；其他的可能非常複雜，可能能揭示高度非線性的關係。此外，儘管我們往往更希望捕獲的是複雜性，但是和簡單算法相比，複雜的算法往往需要更高的信噪比和更多的訓練數據才能夠有效的學習。使用複合算法和方法旨在捕獲簡單和複雜的關係，並最小化過度擬合的風險。

一般來說，建模者應當關注那些在有噪音的數據上被證明可以成功的算法，以及那些有眾所周知優缺點的算法。作為一個實際的問題，一個好主意是使用軟件庫裡有的那些算法，並在各種應用當中進行了測試。但是，如果不進行進一步的參數調整，僅僅使用現成的算法是不太可行的。因為在選股當中信噪比往往較低，算法常常會需要做參數化，從而嚴重限制了算法過度擬合的可能性。與所有的投資策略一樣，從業者應當避免在樣本中優化模型。

我們應該使用哪些訓練窗口？一般來說，我們希望用於算法訓練的數據可以反映預期的未來環境。例如，我們可能希望使用與預期環境時間相似的訓練子集，表現出類似的宏觀經濟條件（例如估值水平，流動性或增長動能），或者在一年中的同一時間發生（捕獲季節性）。相反，如果我們對預期的未來環境不確定，我們就會希望在儘可能更大，更長和更廣泛的數據集上進行訓練，以捕獲各種可能的環境。但是，這種方法需要更長的運行時間，而且可能無法捕獲特定週期的模式。

另一個需要考慮的就是模式的截面變化。例如，如果我們認為不同的地區或行業會表現出不同的因子和回報關係，那我們就需要針對這些不同的地區和行業分別訓練算法。相反地，如果我們把訓練集拆的過細，那過度擬合的風險就會上升。例如，為美國股票和日本股票分別設定訓練集可能是有道理的，但為美國科技股和日本汽車股分別設定訓練集就太誇張了。

我們應當包含哪些因子？領域知識對選擇因子和構建因子以提高信噪比都是至關重要的。為了最小化運行時間並限制過度擬合，從業者應當只給算法提供可能與未來股票回報相關的數據。這些數據包括與未來經濟成功有關的因子（基本面因子）和未來供需有關的因子（技術面因子）。由於MLAs通常很擅長處理共線數據，如果我們無法確定哪些因子是最相關的，那我們可以納入許多相似的因子，儘管太多的相似因子會增加運行時間。

領域知識也有助於在結構化數據的時候最大化信噪比。如果目標是選擇個股，而非選擇行業或部門，我們應當相應的調整數據。對許多因子來說，將其對行業或部門中立化有助於減少方差，而且不會顯著的降低平均因子回報（見Asness, Porter, and Stevens 2000）。因此，在行業的層面中和因子可以提高信噪比，使算法可以更容易瞭解因子和預期收益之間的關係。

一個案例

在本節中，我們將介紹一種股票選擇的方法，使用了之前在截面設置中討論過的一些技術。我們的目標是展示機器學習在股票選擇上的一般能力，而非討論與特徵工程相關的任何特定決策的有效性。從業者有非常大的空間來應用他們自己的專業知識並可以取得比這裡報告的更好的結果。

數據

表1提供了實例的彙總統計信息。它囊括了22個發達市場的小、中、大盤股，月平均5907支個股。我們的因子庫由194個因子組成（公司特徵），它們由IHS Markit從不同的來源收集而來。我們包含了21個深度價值因子，18個相對價值因子，10個關注收益質量的因子，26個關注收益動量的因子，26個關注歷史成長性的因子，35個流動性因子，29個管理質量和盈利能力的因子和29個技術面價格因子。超額收益的定義是高於無風險利率的收益，來自Barra。我們的樣本期是1994年到2006年，從2004年開始（留出10年的訓練期）。預測的期限和數據頻次均為月度。綜合不同期限的預測可能是有益的，但我們為了提供足夠的訓練集並與典型的因子研究維持一致，選擇了以月度為期限。我們給模型預測和交易之間留出了兩天的餘量，以適應運行時間和參數調優。

注：股票的平均數量代表樣本中每月股票的平均數量，美國的數據始於1988年，其他數據均始於1994年。

特徵工程

表2概述了在前進框架中每月執行的一般工作流。我們首先定義了三個訓練集：

1. 最近的訓練集包括了之前12個月的所有數據。

2. 季節性訓練集包括了過去10年同一日曆月的所有數據。

3. 對沖訓練集以之前兩套訓練集為基礎，包括了10年期內表現處於下半部分的那些數據。

單個月度數據有可能出現在多個訓練集當中。例如，去年某月的數據會同時出現在最近訓練集和季節性訓練集當中。

注：每個月，會根據歷史數據創建三個訓練樣本：最近的，季節性的，對沖的。然後，我們應用了包括標準化區域特徵和行業的特徵在內的特徵工程。我們還根據地區/行業將股票分為了贏家和輸家。當接收到新的特徵數據時，我們對其應用於訓練集相同的特徵工程步驟，並使用之前訓練過的算法來生成預測。

我們開發了這些訓練集，並作為四個獨立區域分別訓練了我們的算法：美國，日本，歐洲和除日本外的亞洲。每個日期的所有因子都是按照地區和行業分類的百分比排序。我們通過將每支股票的超額收益除以其過去一百天的波動率，創建了風險調整後的超額回報率。根據風險調整後的收益率，我們將股票按照地區/行業分為贏家和輸家兩部分。

下一步，我們在每個區域性訓練集上訓練了四種不同的算法——一個使用AdaBoost的bagging估算器，一個梯度增強分類和迴歸樹(GBRT)算法，一個神經網絡，一個使用支持向量機的bagging估算器。

一個使用AdaBoost作為基礎學習器的的bagging估算器。AdaBoost使用了決策樹樁或最大深度為1的樹作為基本估算器。我們進行了50次助推迭代，學習率為1。然後我們使用了一個結合了20個隨機AdaBoost預測的bagging估算器。該算法由scikit-learn庫實現。

一個梯度增強分類和迴歸樹算法。我們使用XGBoost分類器進行GBRT綜合預測，學習率為0.05，我們使用了300次助推迭代。我們還將樹的最大深度設定為3來限制過度擬合。通常來說，我們發現低學習率會帶來不錯的結果，只要他們被大量的助推迭代所綜合補償。但是，大量的助推迭代確實增加了運行時間。

一個神經網絡。我們使用TensorFlow庫實現了一個多層感知器。我們使用了4層，包括一個瓶頸層來限制過度擬合。此外，我們在第一層之後應用了20%的dropout。我們使用"tanh"來激活函數，因為我們發現它們在我們的訓練集上的預測精度始終優於通常選擇的"ReLU"激活函數。

一個使用支持向量機作為基礎學習器的bagging估算器。我們使用徑向基礎函數 (RBF)核，並結合了20個支持向量機（SVM）模型的預測，它們使用了scikit-learn bagging估算器。對支持向量機(SVM)來說，計算預測類概率是非常昂貴的，所以作為替代，我們選擇了決策函數輸出，該輸出傾向於與概率成正比。

AdaBoost和SVMs都相對較慢，也難以並行化。使用這些MLAs作為bagging（而不是boosting）估算器的基礎學習者可以顯著的縮短運行時間，因為他們可以在多個CPU上運行。對於每一類算法，我們在訓練窗口都使用同樣的訓練參數。參數在2004年之前選擇。

對於這12個模型（3個訓練窗口*4個MLAs），我們得到了每支股票和每個月的超額表現概率（這些是連續變量）。在最後一步當中，我們對每個地區/行業中每個日期的12個預測分類概率進行了百分位排序，並取其平均值以得到了綜合機器學習信號。

我們還分析了兩個基準模型。第一個模型使用的預測來自一個在12個月滾動窗口上訓練的OLS模型，該模型與其他機器學習模型的因子相同，並按照日期，地區和行業進行Z評分。第二個模型當中，我們通過模擬每個因子的十分位差，來遞歸確認每個地區每個日期下夏普比率最高的10個因子；對於每支股票，我們將前10個因素的得分取平均值。在未報告的結果當中，我們發現將所有候選因子等權重處理表現的明顯更差，所以我們選擇使用更具挑戰性的基準。

結果

我們根據綜合信號，將股票分為十分位數。然後，我們通過計算頂部和底部十分位的差值（即長短組合）。對於一種變體，我們在每個十分位數中對股票進行等權重加權；對於另一種變體，我們使用每支股票的100天曆史標準差來衡量我們的頭寸。

圖3顯示了對美國地區和世界其他地區（ROW）進行綜合預測的好處，這基於積累十分位價差回報。在這兩個地理區域當中，粗的線表示對應的十分位差，而細的線表示按算法或者按訓練窗口分組的十分位差。在這些圖中，我們展示了風險加權變量，但和等權重變量的結果在性質上是相似的。對於所有的算法和訓練集而言，結果都是強的，但綜合預測的結果甚至更強。訓練窗口多樣化的好處表現的尤為明顯。

注：該圖顯示的是不包含各種預測子集積累的十分位差收益。在每個十分位當中的股票都以其100天波動率的倒數來加權。算法子集在給定的算法下應用於所有的訓練窗口；訓練窗口子集使用給定訓練窗口的所有算法。綜合預測則使用了所有的訓練窗口和算法。

注：該模型使用XGBoost，期限是2006年12月到2016年12月。IndRelRtn5D是過去5天的行業相對回報率。IndRelRtn4W是過去4周的行業相對回報率。Sigma60D是將一支股票60天的日回報率和行業回報率進行迴歸得出的殘差的標準差。SIP是指賣空股票股票數量佔總流通股的比例。VolDiff_PC是平價看跌期權和看漲期權之間的隱含波動率之差。DR_1MStd是一個月的回報波動率。股票評級是分析師們對該股的普遍評級。

在圖3中，我們使用了十分位差來衡量各種預測方法的表現。由於其非線性的特質，機器學習算法沒有可解釋的係數，但我們可以定期梳理那些貢獻最大的。圖4顯示了美國區域梯度增強分類樹的平均重要特徵（10個最重要的特徵），這是通過檢查一個特徵在樹中出現的頻率和級別來評估的。因為樹是有條件的，這個度量並不表示相關性信號。儘管它有許多的限制，但這類分析仍然可以提供重要的洞見，並且幫助從業者判斷一個算法是否合理。

我們在表2中報告了所有模型的和綜合模型的ICs 列（信息係數）和t檢驗。IC衡量的是Spearman排名——股票排名和未來回報之間的關係，這涵蓋了所有的預測，而不僅僅是極端的十分位數。正如圖2所示，綜合預測表現的比所有算法/訓練窗口的組成部分都要更好，這說明了綜合預測的好處。這些結果與圖3所示的結果的一致；也就是說，ML組合提供了比任何單獨的算法/訓練窗口組合更好的結果。它還輕鬆的超過了OLS基準和一個對夏普比率最高的10個因子進行等權重加權的基準。

注：MKT是Fama-French(1992)的市場風險因子。

注：該表顯示了月度平均超額回報和阿爾法。"美國區"的標籤包括美國股票；"ROW"（世界其他地區）標籤包括其他所有地區股票。在B版中，交易成本假設為單邊15個基點。

表3展示了某些MLA組合和Fama and French (1992) 市場風險因子 (MKT)之間的相關性。有趣的是，等權重的美國十分位利差與市場存在很強的平均負相關性，這意味著該投資組合往往是做多低貝塔係數，以及做空高貝塔係數。然而，正如我們稍後討論的，這些相關性和敞口會隨著時間變化。當我們使用風險加權時，我們得到的市場因子平均相關性要小得多。由於我們的預測傾向於做空高波動性的股票，風險加權頭寸規模導致投資組合略微出現了美元淨多頭，從而抵消了與市場平均負相關性的大部分。

表4顯示了各種十分位差的月平均表現是如何與最初的三個Fama-French因子相關的，即——MKT，SMB（小市值減大市值），HML（高市帳率減低市帳率）和Carhart(1997)的動量因子（MOM）。在A版中，結果為交易成本總額；在B版中，結果是交易成本淨額。在A版中，風險加權投資組合的超額回報和阿爾法往往更大一些，無論是在美國還是其他地區。這個結果並不令人驚訝，因為我們訓練了MLAs來預測按其標準差縮放的回報。等權重的十分位差顯示出非常顯著的回報和阿爾法，但它們的負市場敞口降低了它們的原始回報。這方面也同樣反映在美國地區等權重組合相對較高的R方中，這表明這個投資組合大部分的方差都可以用四個風險因子來解釋，最明顯的是市場因子。

表4還包括了使用相同特性但使用線性迴歸來預測股票回報的基準策略的結果。這個OLS基準策略的結果是正值，但是機器學習的平均回報和阿爾法要大得多。T檢驗的差值越來越大，這表明MLA策略在風險調整基礎上更具優勢。我們還研究了一種策略，即找出每個時點上夏普比率最高的10個因子，並將其等權重加權。這種樸素策略的結果往往比OLS基準的結果更好，但機器學習組合在美國和其他地區的表現都明顯更好。

雖然我們不建議將這些結果解釋為一個成熟的交易策略，我們還是探討了納入交易成本是否會對結果產生重大的影響。扣除交易成本之後的結果列示在表4的B版，我們發現阿爾法還是挺顯著的。

有趣的是，機器學習組合通過對價值因子（HML）和小盤股因子（SMB）表現為負值，但是隻有美國地區等權重下，SMB因子才是顯著的。這一結果表明，積極的結果並不是由共同的風險因子驅動的。動量載荷因子（MOM）在美國地區是正的，對其他地區是負的，但是同樣，只有在美國地區等權重下才是顯著的。這些結果證實了投資組合的結構可以對組合風險產生顯著的影響。

因為阿爾法的重要性不亞於超額收益，因此四因子模型可能無法解釋機器學習策略的回報。相反，MLA組合可能從其他因子中提取信息，或者利用線性風險模型中沒有捕捉到的因子回報的時變關係。

在樣本期內（1994-2016），股票市場中性基金的回報相對較低。例如，對沖基金股票市場中性指數，在2004到2016的月度回報僅為0.24%。在同一時期，所有的機器學習十分位差在估算交易成本後的月度回報都超過了1%。

注：月度回報基於對滯後的公司特徵和ML預測進行迴歸。在等權重規範下，因變量是超額收益；在風險加權規範下，因變量是按照100天跟蹤標準差進行縮放後的超額收益。

在表5當中，我們報告了Fama and MacBeth(1973)基於原始月度超額回報和波動率（風險加權）成反比的綜合機器學習預測的多元迴歸係數。我們控制了一連串的流行的動量因子，並分別對美國地區和世界其他地區進行分析。所有的變量都被標準化處理過，以使參數具有可比性。表5顯示，即使控制了許多流行的定量因子，機器學習綜合預測仍然與所有規格的收益呈顯著相關。或許令人驚訝的是，少部分的控制變量仍表現出適度有效。如果算法有效的利用了這些因子中蘊含的信息，我們可以預期控制因子能夠提供的增量價值很小。然而，這些算法只考慮了時間點信息，而事後識別成功因素要比事前發現來的容易的多。

在表6當中，我們報告了MLA組合多空兩端的收益和四因素阿爾法。與Gu et al.(2018)提到的類似，我們發現大部分的出色表現來自多端。這一發現並不令人驚訝，因為這段時期的股票市場表現的非常好。無論是在美國地區還是世界其他地區，阿爾法在多空組合中都表現顯著。然而，獨立的去觀察多端和空端都無法看到全局。表4顯示的多空組合，阿爾法的t檢驗就比表6顯示的純多和純空組合要來的顯著的多。因為我們限制了機器學習的算法來預測風險和行業的標準化收益，十分位差則消除了大部分行業風險和特質性波動，並增加了風險調整後的收益。這一結果表明特徵工程的潛在好處。

機器學習預測的一個潛在好處是，算法可以動態的學習因子和回報之間的變化關係。表5顯示了美國區域機器學習綜合預測和Fama-French-Carhart因子之間的月度截面相關時間序列。顯然，表3當中的平均相關性並不能說明全部問題；所有這些相關性都存在顯著的時間變化性。例如，儘管平均呈正相關，但我們看到機器學習預測和動量在三個時期呈負相關：（1）樣本開始階段；（2）2009到2011年間；（3）2013到2015年間間歇性存在。這些負相關的時間段往往與動量顯著表現不佳的時段相一致或者緊隨其後。例如，在Daniel and Moskowitz(2016)記錄的動量崩潰之後，動量敞口變成了負值，在2010年的幾個月中，截面相關性圍繞在-0.3左右。如前所述，規模和貝塔的平均相關性往往為負值，但它們隨著時間的變化波動相當大，偶爾會出現正值。

儘管精確的確定機器學習策略的阿爾法有多少是來自因子定時是很困難的，這些因子敞口還是顯然比在典型的線性因子模型中發現的敞口模式更具變化性。

結論

我們討論了從業者如何利用機器學習算法來選股，同時避免這類技術的主要問題——即過度擬合。在低信噪比的狀態下，過度擬合始終都是一個風險，特別是對於MLAs這樣的技術，結構對分析的影響很小。然而，因為他們不需要結構，MLAs技術可以發現複雜的非線性模式，而傳統的統計技術（例如OLS）卻很難發現。在必須考慮多重共線因子時，它們的表現也往往比OLS技術更好。

我們討論了降低過度擬合風險的兩種主要方法——特徵工程和綜合預測。特徵工程可以通過正確構造問題和轉換數據以產生更清晰信號的方法來提高信噪比。綜合預測通過關注不同的預測技術（MLAs）和訓練窗口之間具有強健（魯棒）的關係來降低噪音。一個成功的機器學習應用需要大量的專業領域知識來解決這些問題。MLAs並不會很快取代人類專家（至少在投資方面不會）

在最後一節中，我們列示了基於所提出的一些技術的一項案例研究。我們證明了，如果應用得當，MLAs可以廣泛使用公司的各種特徵來預測股票回報，而不會過度擬合。通過合理的特徵工程和綜合預測，MLAs可以產生大大優於OLS等簡單線性技術的結果。這些MLA結果在各種風險調整下都是強健（魯棒）的，並且在美國市場和其他發達國家市場都表現良好。雖然準確的評估是哪些信號驅動了這些結果是困難的，我們還是證明了傳統的因子敞口隨時間的變化很大，這意味著因子定時對這些積極的結果貢獻很大。

本文的主要貢獻如下：（1）討論了特徵工程和從業者使用機器學習模型進行股票選擇時面臨的一些問題；（2）證明了使用這些技術進行綜合預測的好處。特別的，我們強調了從多種算法和訓練窗口進行綜合預測的好處，並表明MLAs可以提供優於簡單線性模型的結果。

編者注

2018年7月19日提交，Stephen J. Brown 於2019年1月30日接受，2019年5月13日在線發佈。

譯者注：

2019年11月24日翻譯結束。如有錯漏歡迎指正。

因原文鏈接需要權限，希望獲得原文及Notes，Appendix的朋友請留下郵箱地址或留言聯繫。

分享到:

閱讀更多 薛定諤的七 的文章

關鍵字: 人工智能選股算法

數字貨幣資產日內價格跳躍預測

“Aspen Neuroscience”獲得7000萬美元融資

「華泰金工林曉明團隊」上週大多數模型跑贏基準——人工智能選股週報20200322

80%以太坊持有者目前都在虧損但以太坊的牛市還會遙遠嗎？

8成以太坊持有者目前都在虧損，但以太坊牛市在望

IntoTheBlock：大多數以太坊持有者目前都在虧損，但以太坊牛市在望

技術平臺“RoadRunner Recycling”獲2860萬美元C輪融資

「機器學習」探索能源行業5家頂級大數據與機器學習創業公司

IDC：到2023年年底，中國50%的製造業供應鏈環節將投資於供應鏈彈性和人工智能

「華泰金工林曉明團隊」今年中證500增強超額14.10%——人工智能選股週報20191130

這份恆生流動性風險調查報告，90%的證券公司都需要

新三板已設置800餘項預警指標加強年報監管

04.01 關於醫美、醫療分期風控，看專業人士怎麼說？

機器學習中欠採樣+ Logistic迴歸—不平衡的數據

告別紅利時代，企業拿什麼驅動新增長？

外匯交易——背離交易

研究人員開發出預測泵和轉儲方案的算法

用創新致敬成長，圖瑪深維斬獲兩大創新獎項

收賬少“黑臉”，科技賦能金融催收

信貸反欺詐的常用手段：名單庫、專家策略、機器學習

新產品預告｜“一體化信貸審批決策”助力機構升級風控能力

強化學習｜非常基礎

談工業網際網路發展契機

「新零售」對實體店來說有何優勢？

機器學習：信用風險評估評分卡建模方法及原理

陳春花：在共生中創造價值

我們分析了百萬個外賣小哥的路線，發現了4個送餐流派

機器學習將非結構化二級存儲數據變爲可全局訪問的數據

機器不學習：從一棵決策樹到xgboost

08.15 顧宏地：小鵬汽車2019年底要融約300億元

馬云：要想加工資必須勝任更多的工作、提供更高的價值！附：案例

破1000億美元，DRAM市場今年年增39%！

還敢虛開發票？廣東稅務推「機器學習」算法，已找出一批團伙！

您企業的3種最重要的數據類型

公有云業務擴張，全球IT基礎設施收入持續增長

商品精細化運營打造連鎖門店的核心競爭力｜獨家

強勢襲擊——簡單強大外匯市場價格渠道技術（名單）

成熟的標誌，就是接受“灰度”

05.21 理解Bias（偏差），Error（誤差），和Variance（方差）的區別和聯繫？

索羅斯：「風險來自無知！認清金融投資風險，財富只是時間問題！

05.15 「乾貨」一文明白：機器學習數據預處理，為什麼有？怎麼做？

關注炒房還不如關注食譜好

如何準確找到創業的方向？

信用卡是如何審批的，額度是怎麼評估（精）

04.04 AI（人工智能）期貨策略

乾貨丨解密大數據風控體系！

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

剛剛:剛剛工作的畢業生，一個月只有2000多，是不是太少了？根據你城市消費水平來看啊，還有你從事的工作，假如你在二三線城市做一份事業單位或者是編制類的工作，薪資水平是隨著你工作年限逐年增長的，而且在年終也有很多福利補貼待遇等等，算下來收入也是可觀的，再舉一個例:-畢業生 2000

為什麼只有edg賺錢？

電競行業作為一個新興產業，這幾年發展勢頭越來越好，IG戰隊，FPX戰隊先後奪得了s8-s9世界賽的冠軍，據俱樂部知情人士透露，除了國內的幾家豪門俱樂部之外，其他俱樂部基本都是虧錢在做的，當然EDG也是:-edg 賺錢:為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

20000:網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？天貓旗艦店，或者淘寶旗艦店，或者京東旗艦店肯定包真，質量好，再說可以官方驗證啊，不能圖那十塊五塊的便宜，畢竟一個充電寶要用好久呢，一兩年沒問題的。:-羅馬仕馬仕毫安

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

沒有取得房抄產證的房子可以轉讓。但如果確定無法取得房產證的，房產轉讓不受法律保襲護。一般情況下，只有取得房產證的房屋才能確定房屋產權人，才具有轉讓的條件。但如果房屋是合法取得的，以百後可以依法辦理度房:-轉賣房產證商品房拿到:我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

鋒利突厥人你這樣說只能說明你對歷史非常不瞭解，我先用一句話概括突厥被大唐雄兵打的有多慘：三次滅國，背井離鄉，遠赴西亞，打不過，俺躲著你還不行嗎？突厥的意思是中間慫起的頭盔。其來歷已經不可靠，可能有著匈奴、鮮卑或:-復國大唐:為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

小高層 60:小高層16層高樓間距60米哪一層比較好？首先需要明白，選擇層數居住與樓間距毫無關係，住在哪一層，肉眼看對面樓的距離，是相差不大的。設定樓間距60米，純粹是混淆視聽。其實，一幢樓的樓層總數確定的情況下，到底哪一層最佳？很簡單，取總層數乘以黃金:-樓間距層高

金銀花盆栽好養嗎？怎麼養？

金銀花可以盆栽，很好養的！金銀花，是忍冬科的常綠纏繞灌木，枝條柔韌修長，多攀爬或匍匐生長。金銀花生性強健，在我國的很多南方省份野外很多地區都能看到它的身影，葉子常年翠綠，到夏季開花，飄香四溢。所以，有:-金銀花盆栽:金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

長城真的無用嗎？在今天許多人認為長城無用，古代國家舉國之力建造的長城不過只是文物，就連康熙都曾作詩諷刺，原文如下：萬里經營到海涯，紛紛調發逐浮誇。當時用盡生民力，天下何曾屬爾家。-康熙但真的如此嗎？小:-匈奴抵禦長城:長城對於抵禦古代匈奴和蒙古人起到了多大作用？蒙古人

什麼樹可以嫁接臘梅？

臘梅只能嫁接在不同品種的臘梅上，其他的樹種不行！臘梅的繁殖可以用播種，壓條，嫁接，分株等繁殖方法。播種法因不易保持花卉的原有優良特性，且播種的優點是在於大量繁殖，而臘梅大都只需培植少量幾株，故一般都不:-臘梅嫁接:什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

堪憂五一假期:行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？事實上，因為教育培訓都是預收費用的模式。但凡有一點點規模的培訓機構老師。在上半年，帶課量是可以得到保證。:-課時量

在農村“立夏節”都有哪些民間習俗？

民間習俗農村:在農村“立夏節”都有哪些民間習俗？在農村“立夏節”都有哪些民間習俗一、農村立夏常見的習俗風俗活動：1、吃雞蛋“立夏吃蛋”習俗由來已久，俗話說“立夏吃了蛋，夏天不疰夏”。據說立夏開始天氣越來越熱，村裡小孩兒會有身體疲勞四肢無力的感覺，吃:-立夏節

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

失望分手看法:男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？你的這個問題特別的有趣，我覺得你先不要看你要怎麼做才讓他才能讓他對你的印象有所改變，你要去看為什麼是兩個月之後可以在一起，這兩個月他會用來做什麼，為什麼會有這兩個月？例如他的身體碰到了什麼樣的問題嗎？:-答應我

工程分包乙方人員傷殘誰承擔？

承擔:工程分包乙方人員傷殘誰承擔？分包乙方分包致人傷殘責任誰承擔？嚴格來說，需要了解更多傷殘原因才能區分的，作為非專業人士，自己發表一點淺見供題主參考：1、如果甲方是央企的話，他們合同中的責任、義務等條款內已經將自己的責任全部撇開了，更會:-乙方傷殘

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

實際上:有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？歷史人物聯繫這個詞貌似太寬泛了，就好像有一個調皮的答案說的，胡亥和溥儀相隔2000多年，牽強的找，也有聯繫：都是亡國之君不是。我想題主的意思是兩個看起來應該風馬牛不相及的人物，在歷史上居然是熟悉或是一個時代的:-毫不相關

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

法系車不保值，如果準備常開可以入手，性價比高，價格應該在二至三萬之間，二手車一車一況，一況一價，居體價格看車況。:-錢能水泡:13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？世嘉自動擋

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

17年駕駛證二手:22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？建議買日系二手車，開順了賣了，買新車，昂克賽拉無法再次出手時獲得好價格，而且也不省油，開完日系車直接換德系:-昂克賽拉

如何騎車去臺灣騎行？

騎車在臺灣沒有迴歸內地前，最好不要去臺灣，一是國內政策不允許你去臺灣，因為已停止了臺灣個人遊。二是你偷著去臺灣旅遊，安全沒有保障，偷渡客在哪裡也沒有安全保障的。以後內地政策允許個人去臺灣旅遊了，建議那時再:-騎行臺灣:如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

預算:本人預算5萬左右，想買一輛二手法系車！求推薦？ 5萬預算5萬元左右，想買一輛二手法系車？推薦東風標緻老款308車型。1 5萬元可以買標緻308車況好的，沒大事故呢，年限15年左右，公里數3萬左右，手動檔車型。2 標緻308車型，底盤調教紮實，跑高速穩定:-法系二手

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

道奇你好，好高興回答你的問題！14年進口馬自達5和10年月道奇酷威個人感覺馬自達5比較划算。新車價馬5報價29.99萬，酷威19.38萬兩款車都是原裝進口，馬5屬於日系，酷威屬於美系。兩款車不屬於同類車型:-酷威馬自達 14年:14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

特殊津貼高校人才就要重視，河南省高校人才更要重視，這個人才不是評出了的，而是推薦出來的，沒有推薦，連參評的資格都沒有。國務院特殊津貼人員推薦，不推薦是百分百沒希望，推薦了希望就非常，那麼是什麼是國務院特殊津貼:-河南大學並列 2020年:2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

李老貓說車為你非專業解答各種選車用車問題本田crv定位於一款緊湊級suv產品，主要對飈豐田榮放，日產奇駿，這款車整體市場表現非常突出，2019年全年累計銷量為18.44萬臺，平均月銷1.5萬以上，其深:-舒適版本田油耗:本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

1.世界經濟遭到重創疫情影響之下，各行各業基本屬於停工停產的狀態，在世界經濟趨於一體化的今天，停工停產勢必會造成一系列的連鎖反應，最後導致的結果可能會引發金融危機。2.世界格局可能發生改變美國仍是世界:-頭腦風暴控制:國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？疫情國外

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

如果有15萬元的預算，讓你選擇一臺空間和動力都很不錯的小型SUV，我覺得很多的讀者都會想到本田XRV這款車型。因為本田XRV確實太出色了，和同級別的其他盒子SUV車型相比，這款車在空間和動力上都有優勢:-xrv 自動:本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？本田豪華版

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

何去何從:現在存款有14萬，借了5萬還沒收回來，該做什麼好？續租存款利息率較低，可以投資較高收益的項目，比如投資基金，一般情況下可獲得6%一10%的回報。如果行情好可達到50%以上收益，去年不少基金超過這目標。目前受疫情影響，股市在低位震盪，也是基金投資的機會。一:-存款 2300

2070super和5700xt買哪個比較好？

如果是玩遊戲毫無疑問選擇n卡，也就是2070 suep。如果追求性價比可以選擇a卡，也就是5700xt. 為什麼遊戲選n卡呢？首先遊戲廠商針對n卡優化比較多，然後就是功耗小，然後N卡架構執行效率極高，:-:2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

二胎我是兩個孩子的媽媽，曾經的我和你一樣，生完寶寶我也抑鬱了，我知道抑鬱症真的很痛苦，產後的那段日子我整天都不開心，做什麼事也沒積極性，誰也不想搭理，別人給我說話我就覺得很煩。忍不住衝家人發脾氣。每當一個:-生完抑鬱:生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？發火

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

感覺:人這一生遇到的人和事為什麼感覺都像是必然的經歷？正所謂有因必有果，所以你今天的因，就會產生明天的果。所以這一切你就會覺得是必然的。生活中大部分是普通人大家的生活規律，生活方式，大致相同。當你看到別人家庭的果，自己家也產生同樣的果，你就會覺得這一切是:-人和經歷

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

校內:現在校內校外到底教的是美式英語還是英式英語還是混搭英語？校外英式答案肯定是不唯一的！美式英語現在是主流，少量英式發音也個別存在！但對於孩子來說，肯定是混搭英語，因為孩子肯定不是一直一位老師教下去，肯定會換老師！而老師的發音肯定是既有英式的，也有美式的！就連一些英語:-美式英語

上有老下有小，我們真的跳不出這個人生循環了嗎？

上有老魔咒:上有老下有小，我們真的跳不出這個人生循環了嗎？的確如此，儘管現在不結婚，晚婚的人很多，但是從人類繁洐生息的歷史和大多數人來看，成家立業，生兒育女，家庭仍是主流，一個人的生理，心理和生存需求決定了生存狀態，生兒育女，瞻養父母即是義務責任，也是生活動:-下有小

如果外面正在下小雨，你會突然想起了誰？

想起:如果外面正在下小雨，你會突然想起了誰？我最不忘，還是秋日的雨夜，天又涼了幾分，已經需要披上一件薄薄的外套了。臨窗而望，眼見窗臺上的幾株小植物，葉片上沾了幾滴小雨珠，我總喜歡，用小手電去照它們，這樣的小水滴看起來晶瑩晶瑩的，有一種清清涼涼的:-小雨

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

初中同學:初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？吃飯許久未見，意思就是交情不怎麼樣，無功不受祿，人家憑什麼那麼熱情，難道真的是多年一來忘不了咱們之間的同學情誼，倍感想念了嗎，不是請幫忙、做業務、就是借錢，十有八九十借錢。我建議還是不要去的好，大家都很忙:-許久未見

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

出口心理:現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？愛你更多的是心裡問題，可能對方還沒有優秀到你滿意的程度，更沒有到那種離不開的地步！愛情最終還是要回歸生活，而生活離不開兩個人的相處，父母終究會老，孩子終究會飛，所以選擇自己的伴侶尤為重要，你現在覺得噁心更:-喜歡你

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

再見王瀝川好看:劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？《遇見王瀝川》吧，高以翔的王瀝川太招人稀罕了。長相，身材，家世，人品，才能樣樣好，簡直完美，挑不出任何毛病，實在要說一個缺點的話，那就是太tm完美，天妒英才、才讓他飽受病魔折磨。偶像劇、深情帥氣的男主:-何以笙簫默

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

學歷是求職必備條件。有了工作不能停止對知識的探索。更高的學歷，可以讓你有更專業的技術能力和學習能力，可以讓你拓展自己的交際圈，可以讓你更知名。總之，活到老，學到老，學習對人總是有好處的，技多不壓身嘛！:-字節跳動:計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？讀研計算機專業

生完二胎的你們，現在有什麼感想？

二胎家庭日常是什麼樣的？是不是覺得家裡多了一個小人兒，溫馨多了？不存在的！生二胎根本是媽媽們的渡劫磨礪！以前週末睡到自然醒，現在全年無休，時刻警醒著，能睡一次懶覺跟過年似的，黑眼圈不說，頭髮呼啦啦地掉:-生完二胎感想:生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華北適合種植蠶豆，種蠶豆的面積大，在西北，華北，都在種植蠶豆，蠶豆莖稈根部有根瘤菌是種植其它農作物的好茬地，特別是土壤培養和防病蟲害起到作用。:-蠶豆種植適合:華北適合種植蠶豆嗎？華北

華為手機更新EMUI10.1系統後效果咋樣？

大家知道現在智能手機的性能不僅僅跟智能手機的硬件有關，還跟智能手機的系統軟件息息相關，在國產智能手機操作系統裡，小米的MIUI系統跟華為的EMUI系統都是比較優秀的操作系統。最近小米推出了小米MIUI:-咋樣華為華為手機更新:華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

蜜蜂爬到:大熱天蜜蜂老是爬到箱外結群正常嗎？盜蜂現在正是夏季，很多地方蜜源稀少，蜂群中可能缺蜜，也是胡蜂猖獗的時間，所以蜂群中是非常容易發生盜蜂的。在蜂群中發生盜蜂的時候，蜂群守衛蜂會增多，但是這種情況引發的蜜蜂在蜂箱外一般不會結團，只是蜜蜂來:-大熱天

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

最佳期霧都山客來回答您的問題。最近山客家鄉的村民正在進行辣椒移栽，確實有像題主提到的情形，辣椒苗移栽前長勢蔥蔥，嫩綠喜人，但是移栽後幾天內就出現萎蔫現象，細心觀察也不是被病蟲害危害。那究竟是什麼原因導致辣椒:-苗蔫辣椒咋回事:辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

最近這幾年手機在電子產品行業裡可謂是發展速度非常快，蘋果和華為兩大公司可以說也是，明爭暗鬥，產品一次比一次有賣點，前一段時間華為和蘋果還都推出了手機新品，兩家都在大力宣傳強調著拍照功能，像iPhone:-形態相機手機最終:手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

5寸手機支持:華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？很高興回答你的問題，刷頭條刷出來的問題，看到很多人回答，感覺還有一些觀點沒有寫出，所以我來回答一下。首先，華為為什麼不出小尺寸全面屏手機？其實並不只有華為一家沒有出小屏手機，放眼近期各大手機廠商發佈的:-華為

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

胡蘿蔔蔬菜:生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？第一種，黃瓜。這個瓜，可不是菜市場中堆放滿滿的青瓜。各位可要睜大眼睛看清楚了，這個黃瓜，青中帶黃，品種屬以前鄉下農戶少量種植的，形態上面來看這種瓜矮、短、圓，表面覆蓋有比較淡的細毛，經水輕輕沖洗之後整:-山芋

為什麼馬鈴薯不宜過早過遲播種？

不宜:為什麼馬鈴薯不宜過早過遲播種？播種過早為什麼馬鈴薯不宜過早過遲播種？馬鈴薯的種植主要是由於氣候條件的限制，過早出苗後容易遇到低溫被凍死，種植晚了容易遇到乾旱和高溫，影響產量。馬鈴薯種植時間的早晚必須根據種植地方的氣候條件來確定。馬鈴薯生長:-馬鈴薯

疫情愈發嚴重，原油為何反而大漲？

原油愈發:疫情愈發嚴重，原油為何反而大漲？疫情愈發嚴重和原油大漲沒有必然關係。但是資金總是從高處流向低處，原油價格跌的越多，投資價值越明顯，相對於其他產業更有投資價值。舉個例子：深圳南山房價均價大約6萬左右，寶安均價5萬左右，如果南山房價漲到:-疫情

生菜球很好吃，怎麼種植才能高產呢？

種植:生菜球很好吃，怎麼種植才能高產呢？高產對環境條件的要求、1.溫度生菜球為喜冷涼、忌高溫作物，種子在4度以上可發芽、以15～20度為發芽適溫。幼苗能耐較低溫度，日平均溫度12度時生長壯健，葉球生長最適溫度為13～16度。不過目前有些結球生菜:-生菜

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？

看下這個戶型三房改四房，改一個小房間，應該沒有問題。△原戶型圖這個戶型改四房，能改的方案比較多，但是修改以後是否好用，是一件值得考慮的事情。一、主臥室變為兩個臥室可以將主臥室改為兩個臥室，但是這樣的改動佔:-房改 122:裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？ 144

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

房子:大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？這個戶型砸牆，當然可以砸牆，但是在砸牆之前，要搞清楚為什麼要砸牆，砸牆以後有什麼優劣。△原戶型原戶型圖上的白色牆體部分不是承重牆，理論上說否可以砸掉。但是外牆和與旁邊戶型或者是公共區域的共用牆體和圖上:-幫忙

意蜂夏季喝什麼水降溫？

降溫意蜂夏季喝什麼水降溫？氣溫高，蜂巢溫度高的情況下，蜜蜂是通過採水的辦法掛在蜂箱的四壁來蒸發帶走熱量，降低蜂巢溫度同時也能幫助蜂群維持正常的溼度。在平常的情況下，蜜蜂是在室外採自然水的。夏季消耗的水量:-意蜂夏季:意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

黃瓜種子:黃瓜種子催芽後種植需要打底水嗎？你好很高興回答這個問題。答案：不用。1-2天可出芽。黃瓜種子催芽：選用飽滿的種子，用30℃水浸泡4小時後催芽。也可用100倍福爾馬林溶液浸泡種子10-20分鐘，洗淨後清水浸種3-4小時，然後於25-3:-催芽黃瓜打底

書友們展示一下自我感覺發揮較好的作品，一起學習？

自我較好這幅作品是參賽的，色彩的搭配，紙張的拼接都是自己設計完成的，一如既往的清新淡雅感覺。書體用的魏碑中楷書，增加了書寫的趣味性。:-書友展示:書友們展示一下自我感覺發揮較好的作品，一起學習？