Arxiv網絡科學論文摘要23篇(2020-04-14)

  • COVID-19流行期間因流動限制而造成經濟隔離的證據;
  • 理解COVID-19早期的美國社會經濟擾動;
  • 基於物理過程的參數化模型用於研究COVID-19流行病的傳播;
  • 流行病到達時間;理論,討論與侷限;
  • 輿論傳播動力學的最新進展:2020年綜述;
  • WES:實際基礎架構基於主體的用戶交互模擬;
  • 使用複雜網絡分析提取地震時間序列中的相關性;
  • 具有指定度數和維數序列的超圖的構造和隨機生成;
  • 邁向B-TAMBiT:帶單詞和雙語測試調節器的反向翻譯;
  • 城市街道網絡的多重分形標度分析:以中國十二個特大城市為例;
  • 連續利潤最大化:無約束Dr-次模最大化的研究;
  • 探索基於隨機遊走的小批量選擇策略對知識圖譜補全的影響;
  • 誰是政治高音喇叭?,政治高音喇叭與非政治性人物高音喇叭的人口比較;
  • 在線社區違反規範-Stack Overflow評論研究;
  • 行為變化及其對知名度提升的影響:微博從精英到大眾;
  • 深度地震全球序列的長期相關性研究;
  • 離散主體人口信息網絡中的社區結構;
  • 具有間接傳輸鏈接和有限聯繫信息的動態網絡上的疫苗接種策略;
  • 在線產品評論中檢測和鑑定極端主義評論者組;
  • 通過延遲優化含時圖中的可達性集;
  • 迴歸基礎:使用結構信息對科學文獻進行聚類;
  • paper2repo:學術論文的GitHub存儲庫推薦;
  • mFLICA:從時間序列推斷協調領導力的R包;
  • COVID-19流行期間因流動限制而造成經濟隔離的證據

    原文標題: Evidence of economic segregation from mobility lockdown during COVID-19 epidemic

    地址: http://arxiv.org/abs/2004.05455

    作者: Giovanni Bonaccorsi, Francesco Pierri, Matteo Cinelli, Francesco Porcelli, Alessandro Galeazzi, Andrea Flori, Ana Lucia Schmidt, Carlo Michele Valensise, Antonio Scala, Walter Quattrociocchi, Fabio Pammolli

    摘要: 為了應對COVID-19大流行,各國政府已實施鎖定限制以降低感染率。我們對Facebook提供的近乎實時的意大利數據進行了大規模分析,以研究鎖定策略如何影響個人和地方政府的經濟狀況。我們將流動性變化建模為類似於自然災害的外來衝擊。我們確定了流動限制對意大利公民的兩種影響方式。首先,我們發現,在財政能力較高的城市,封鎖的影響更大。其次,我們發現了隔離效應,因為在不平等程度較高且個人人均收入較低的城市中,流動限制更加嚴格。

    理解COVID-19早期的美國社會經濟擾動

    原文標題: Understanding the Socio-Economic Disruption in the United States during COVID-19’s Early Days

    地址: http://arxiv.org/abs/2004.05451

    作者: Swaroop Gowdra Shanthakumar, Anand Seetharam, Arti Ramesh

    摘要: 在本文中,我們收集和研究Twitter通訊,以瞭解大流行初期COVID-19在美國的社會經濟影響。我們的分析表明,在這段時間內,COVID-19席捲了整個國家,這一點已得到大量趨勢標籤的證明。隨著感染迅速飆升,用戶上了Twitter,要求人們自我隔離並隔離。用戶還要求關閉學校,酒吧和餐館,以及封鎖城市和州。來函顯示,隨之而來的恐慌性購買和某些基本商品(尤其是廁紙)的供應不足。我們還觀察到,隨著病毒繼續傳播,用戶對通信表示沮喪。通過識別和跟蹤與COVID相關的流行標籤,我們有條不紊地收集了530206條推文。然後,我們將主題標籤分為六個主要類別,即1)普通COVID,2)隔離,3)緊急購買,4)學校關閉,5)鎖定和6)沮喪和希望,並研究這些推文的時間演變主題標籤。我們對所有主題標籤組所共有且特定於每個主題標籤組的單詞進行語言分析。我們的初步研究提供了人們對大流行病反應的簡潔概括的圖片,併為將來進行細粒度的語言和行為分析奠定了基礎。

    基於物理過程的參數化模型用於研究COVID-19流行病的傳播

    原文標題: Parametrization Model Motivated from Physical Processes for Studying the Spread of COVID-19 Epidemic

    地址: http://arxiv.org/abs/2004.05992

    摘要: 除了對人類健康的危害和損失之外,新病毒COVID-19的爆發還引起了範圍廣泛的人類活動中非常嚴重的問題,包括基礎和應用科學研究,主要涉及世界範圍的合作。我們所有人都希望能夠快速預測疾病的每日病例曲線中的轉折點。在這項工作中,我們主要通過創建一個可靠的數學模型來描述一個孤立的社會,城市甚至整個國家的這種可靠的數學模型,從而解決了COVID-19病毒疾病傳播的問題。利用粒子探測器物理中出現的類似機制,我們集中於所謂的n度半高斯函數。這種方法可以在對感染者每日報告病例的數據分析中提供一些非常有用的優勢。應用此模型並對數據進行擬合(在提交本研究報告之前一直進行報道),我們已經確定了除其他外,研究中一個社會中公民的平均感染時間。我們還在其他國家/地區報告的案件中應用並採用了該模型,並且進行了有益的比較和結論。

    流行病到達時間;理論,討論與侷限

    原文標題: Epidemic Arrival Times; Theory, Discussion, and Limitations

    地址: http://arxiv.org/abs/2004.05557

    作者: Alastair Jamieson-Lane, Bernd Blasius

    摘要: 在過去的一個世紀中,世界航空公司網絡的興起導致我們的“距離”和“親近性”觀念發生了急劇變化,無論是在貿易和旅行方面,還是在疾病傳播方面(較不理想)。使用來自WAN的飛行數據,以及大大簡化的流行模型,我們能夠以有效的計算方式預測任意初始條件下的流行到達時間。我們的框架為Brockmann &Helbing(2013)最初引入的“有效距離”提供了理論上的證明,但是我們也觀察到,這種啟發式方法的預測能力明顯低於以前的報道。對我們框架的進一步改進允許進行預測,即使是在已知過去方法失敗的參數範圍內,也可以說明此類方法可能會失敗的情況。

    輿論傳播動力學的最新進展:2020年綜述

    原文標題: Recent advances in opinion propagation dynamics: A 2020 Survey

    地址: http://arxiv.org/abs/2004.05286

    作者: Hossein Noorazar

    摘要: 意見動態吸引了來自不同領域的研究人員的興趣。個人之間的本地交互為整個系統創造了有趣的動力。從各種角度來看,這種動態變化都很重要。小組決策,成功的營銷和構建網絡(可以達成或阻止共識)是現有或潛在應用程序的一些示例。互聯網的發明使觀點融合變得更快,更單方面並且整體上不同。虛假新聞,宣傳和選舉干擾的傳播已經明確表明,有必要進一步瞭解這些動態。在過去的幾年中,該領域新思想的出現加速了。 2020年第一季度,至少發表了50篇研究論文,無論是經過同行評審和發表,還是在諸如arXiv的預印本上。在本文中,我們總結了這些突破性的想法及其引人入勝的擴展,並介紹了新開發的概念。

    WES:實際基礎架構基於主體的用戶交互模擬

    原文標題: WES: Agent-based User Interaction Simulation on Real Infrastructure

    地址: http://arxiv.org/abs/2004.05363

    作者: John Ahlgren, Maria Eugenia Berezin, Kinga Bojarczuk, Elena Dulskyte, Inna Dvortsova, Johann George, Natalija Gucevska, Mark Harman, Ralf Lämmel, Erik Meijer, Silvia Sapora, Justin Spahr-Summers

    摘要: 我們介紹了基於Web的仿真(WES)研究議程,並介紹了FACEBOOK的WW系統。我們在FACEBOOK上描述了WW在可靠性,完整性和隱私性方面的應用,該應用被用於模擬由數億行代碼組成的基礎架構上的社交媒體交互。 WES議程借鑑了許多研究領域的研究成果,包括基於搜索的軟件工程,機器學習,編程語言,多智能體系統,圖論,博弈AI和AI輔助博弈。最後,我們提出了一系列未解決的問題和研究挑戰,以推動更廣泛的研究。

    使用複雜網絡分析提取地震時間序列中的相關性

    原文標題: Extracting correlations in earthquake time series using complex network analysis

    地址: http://arxiv.org/abs/2004.05415

    作者: Sumanta Kundu, Anca Opris, Yohei Yukutake, Takahiro Hatano

    摘要: 使用複雜網絡的理論,我們展示了三種不同類型地震的地震記錄的一些非平凡特徵:常規地震,地震群和震顫。對於每種類別,我們研究兩種時間序列:幅度時間和事件間時間(IET)。根據可見性圖的標準,通過將每個地震事件視為一個節點並確定鏈接,將地震時間序列映射到一個複雜的網絡中。我們對度分佈的分析表明,以上三類地震的震級在統計上是不相關的。另一方面,對於所有類別的地震,IET系列都表現出類似於布朗運動的相關性。時間序列的可見性圖都顯示了小世界的行為,高度的聚類和層次結構。此外,我們發現可以通過關聯的能見度圖的拓撲來區分三種不同類別的地震的時間序列。對分類係數的分析還表明,群體比震顫更斷斷續續。

    具有指定度數和維數序列的超圖的構造和隨機生成

    原文標題: Construction and Random Generation of Hypergraphs with Prescribed Degree and Dimension Sequences

    地址: http://arxiv.org/abs/2004.05429

    作者: Naheed Anjum Arafat, Debabrota Basu, Laurent Decreusefond, Stephane Bressan

    摘要: 我們提出了構建和隨機生成超圖的算法,這些圖沒有循環,並具有規定的度和維數序列。目的是為馬爾可夫鏈蒙特卡羅方法提供起點和替代方法。我們的算法利用了屬性的轉置和針對由零和一組成的矩陣而設計的算法,這些矩陣具有規定的行和列總和到超圖。當不提供初始超圖時,構造算法擴展了馬爾可夫鏈蒙特卡羅方法的適用性。隨機生成算法允許開發針對超圖屬性(例如平均聚類係數)的自歸一化重要性抽樣估計器。我們證明了所提出算法的正確性。我們還證明了隨機生成算法會以非零概率按照指定的度數和維數序列生成任何超圖。我們根據經驗和比較評估隨機生成算法的有效性和效率。實驗表明,隨機生成算法可提供穩定,準確的平均聚類係數估計值,並且與馬爾可夫鏈蒙特卡洛方法相比,還證明了更好的有效樣本量。

    邁向B-TAMBiT:帶單詞和雙語測試調節器的反向翻譯

    原文標題: Towards the B-TAMBiT: A Back-Translation with an Adjudicator with Mono and Bilingual Tests

    地址: http://arxiv.org/abs/2004.05509

    作者: Mahamadou Kante, Euloge François Kouame, Macire Kante

    摘要: 研究人員已轉向各種學科來尋找可以以不同方式對信息隱私做出貢獻的理論。這些理論的數據收集工具(問卷)是英語。但是,與社交網站相關的問題是針對具有不同文化背景的各個群體的。因此,大多數情況下使用跨文化和國際研究來解決這些平臺面臨的問題。今後,有必要將這些文書翻譯成其他語言,例如法語。在本文中,我們使用了來自不同方法(B-TAMBiT)的不同技術,為英語儀器翻譯成法語提供了一種混合方法。

    城市街道網絡的多重分形標度分析:以中國十二個特大城市為例

    原文標題: Multifractal scaling analyses of urban street networks: the cases of twelve megacities in China 2020-04-12

    地址: http://arxiv.org/abs/2004.05545

    作者: Yuqing Long, Yanguang Chen

    摘要: 鐵路和公路的城市交通運輸網絡被證明具有分形性。但是,以前的研究主要基於單分形標度。為了揭示城市的空間複雜性,本文致力於探討中國12個城市街道網絡中的多重分形標度。城市聚類算法(CCA)用於識別城市邊界並定義街道系統。然後,採用盒計數法計算廣義相關維數和質量指數,利用基於微權重的直接確定法估計奇異指數和局部分形維數。參數估計的基本算法是固定截距線性迴歸分析。結果反映了城市街道網絡的重要的多重分形結構。全局多重分形維數譜,即Dq-q譜,是一條倒S形曲線,而局部多重分形維譜,即f(a)-a譜,是右傾單峰曲線。如果矩階q接近負無窮大,則廣義相關維將超過嵌入空間維2,並且對數-對數圖上用於局部參數估計的分散點將變得無序。得出的結論如下。遵循多重分形定律,城市交通網絡圍繞城市中心和次中心發展並形成層疊結構。街道系統的主要特徵是空間異質性和不對稱的級聯結構。通過優化低密度地區和邊地區的交通網絡,我們可以提高城市系統的可達性和交通水平。

    連續利潤最大化:無約束Dr-次模最大化的研究

    原文標題: Continuous Profit Maximization: A Study of Unconstrained Dr-submodular Maximization

    地址: http://arxiv.org/abs/2004.05549

    作者: Jianxiong Guo, Weili Wu

    摘要: 利潤最大化(PM)是選擇用戶子集作為在線社會網絡中病毒式營銷的種子,它可以在成本與影響力傳播的利潤之間取得平衡。我們將PM擴展到一般營銷策略下的PM,並形成持續利潤最大化(CPM-MS)問題,其問題在整數晶格上。我們的CPM-MS的目標功能是dr-submodular,但不是單調的。這是無約束dr-submodular最大化(UDSM)問題的典型案例,以它為出發點,本文對UDSM進行了系統的研究,與已有的研究者截然不同。首先,我們介紹了基於格的雙貪婪算法,該算法可以獲得恆定的近似保證。但是,存在一個嚴格且不切實際的條件,即要求目標值在整個域上都是非負的,否則就沒有理論上的界限。因此,我們提出了一種技術,稱為基於格的迭代修剪。它可以有效地縮小搜索空間,從而大大增加了在不損失逼近率的情況下在此較小域上滿足非負目標函數的可能性。然後,為了克服估計CPM-MS的目標值的困難,我們採用了反向採樣策略,並將其與基於格的雙重貪婪(包括修剪)相結合,而不會損失其性能,但會減少其運行時間。整個過程可以視為解決UDSM問題的通用框架,尤其是應用於社會網絡時。最後,我們在幾個真實的數據集上進行實驗,以評估所提出算法的有效性和效率。

    探索基於隨機遊走的小批量選擇策略對知識圖譜補全的影響

    原文標題: Exploring Effects of Random Walk Based Minibatch Selection Policy on Knowledge Graph Completion

    地址: http://arxiv.org/abs/2004.05553

    作者: Bishal Santra, Prakhar Sharma, Sumegh Roychowdhury, Pawan Goyal

    摘要: 在本文中,我們探討了不同的小批量採樣技術在知識圖完成中的作用。知識圖完成(KGC)或鏈路預測是預測知識圖中缺少的事實的任務。通常使用保證金,軟保證金或交叉熵損失函數來訓練KGC模型,該函數促進為真實事實三元組分配更高的分數或概率。 Minibatch梯度下降用於優化這些損失函數,以訓練KGC模型。但是,由於每個小批量僅包含來自大型知識圖中的幾個隨機採樣的三元組,因此在大多數情況下,小批量中出現的任何實體都只會發生一次。因此,這些損失函數會忽略任何實體的所有其他鄰居,這些實體的嵌入將在某個小批量步驟中進行更新。在本文中,我們提出了一種新的基於隨機遊動的小批量採樣技術,用於訓練KGC模型,該技術優化了由緊密相連的三元組子圖(而不是隨機選擇的三元組)的小批量所引起的損失。我們已經顯示了使用我們的採樣技術對不同模型和數據集進行實驗的結果,發現所提出的採樣算法對這些數據集/模型具有不同的影響。具體來說,我們發現我們提出的方法在DB100K數據集上達到了最先進的性能。

    誰是政治高音喇叭?,政治高音喇叭與非政治性人物高音喇叭的人口比較

    原文標題: Who are Political Retweeters?, Demographic comparison of political retweeters with retweeters of non-political personalities

    地址: http://arxiv.org/abs/2004.05587

    作者: Muhammad Umer Gurchani

    摘要: Twitter多年來一直是政治學研究的焦點,因為它提供了機會來直接觀察政治信息在不同社區中的傳播。在這裡,我們將研究信息傳播現象,並將重點放在負責在Twitter網絡上各處傳播政治信息的節點上。本文試圖使用來自大多數活躍的法國政治低音炮的名稱和位置相關數據的各種技術來填補政治低音炮人口統計方面的空白。在這裡,我將嘗試根據性別,語言,位置,教育程度和自我描述按類別列出這些帳戶的細分。為了將有關政治高音喇叭的信息放在上下文中,我們還將創建一類非政治高音喇叭,以就上述變量在各組之間進行比較。

    在線社區違反規範-Stack Overflow評論研究

    原文標題: Norm violation in online communities — A study of Stack Overflow comments

    地址: http://arxiv.org/abs/2004.05589

    作者: Jithin Cheriyan, Bastin Tony Roy Savarimuthu, Stephen Cranefield

    摘要: 規範是社區中的行為期望。在線社區也應遵守系統行為準則中表達的規則和規定。即使社區主管部門不斷提示其用戶遵守法規,但據觀察,仇恨言論和侮辱性語言的使用也在增加。在本文中,我們在發表評論的同時,對Stack Overflow(SO)的用戶進行了量化和分析,該模式是Stack Overflow(SO)的用戶-專業,發燒友程序員的著名技術問答網站。儘管該站點一直致力於解決技術問題和調試,但仇恨言論以及發表令人反感的言論仍使社區“有毒”。通過在不同的SO社區中識別和最小化各種違反規範的模式,社區的毒性將降低,從而使社區可以更有效地參與其知識共享的目標。此外,通過自動檢測此類評論,版主可以警告作者,從而減少重複的可能性,從而可以提高站點和社區的聲譽。基於從SO的兩個不同數據源中提取的註釋,這項工作首先提出了違反的規範的分類法。其次,它表明了對某些違反規範的制裁。第三,它提出了一種推薦系統,該系統可用於警告用戶他們將要違反規範。這可以幫助實現在線社區中的規範遵守。

    行為變化及其對知名度提升的影響:微博從精英到大眾

    原文標題: Behavior variations and their implications for popularity promotions: From elites to mass in Weibo

    地址: http://arxiv.org/abs/2004.05591

    作者: Bowen Shi, Ke Xu, Jichang Zhao

    摘要: 社交媒體在產生和消費信息方面的繁榮同時表明在線用戶影響力在確定內容受歡迎程度方面的關鍵作用。尤其是,瞭解有影響力的精英與大眾基層之間的行為差異是交流中的重要問題。但是,很少解決用戶行為在用戶類別和內容域之間如何變化以及這些差異如何影響內容受歡迎度的問題。新浪微博是中國最受歡迎的類似Twitter的服務之一,它從七個內容域的新穎視角,從精英和大眾的角度繪製了五個用戶組之間行為變化的詳細圖片。有趣的是,精英們通過視頻鏈接發佈了更多不同的內容,而大眾則擁有更高忠誠度的轉發器。根據這些變體,討論並證明了增強內容流行度的面向用戶的動作。最令人驚訝的發現是,內容的多樣性並不總是帶來更多的轉發,而大眾和精英應該分別通過增加其轉發者的數量和忠誠度來促進內容的普及。我們的結果首次證明了在社交媒體中採用高度個性化的流行度提升策略而非通用原則的可能性。

    深度地震全球序列的長期相關性研究

    原文標題: Long-range correlation studies in deep earthquakes global series

    地址: http://arxiv.org/abs/2004.05674

    作者: Douglas S. R. Ferreira, Jennifer Ribeiro, Paulo S. L. Oliveira, André R. Pimenta, Renato P. Freitas, Andrés R. R. Papa

    摘要: 在本文中,我們考慮了震級為 m geq 4.5 的地震,使用世界範圍內深地震(深度大於70 km)的數據進行了地震學研究。我們已經從複雜網絡的角度解決了這個問題,使用時間窗口模型構建了深地震網絡,這些網絡呈現出無標度和小世界的特徵。這項工作是對先前研究的擴展,該研究使用類似的方法來處理淺層事件。我們針對深層地震的結果與針對淺層地震的結果相符,因為深層地震的連通性分佈也遵循q指數分佈,並且存在標度行為。我們的結果使用複雜網絡和非擴展統計力學進行了分析,有助於加強使用時間窗口模型構建震中網絡。它們加強了地震與地震系統的關鍵性之間的遠距離聯繫的想法。

    離散主體人口信息網絡中的社區結構

    原文標題: Community Structures in Information Networks for a Discrete Agent Population

    地址: http://arxiv.org/abs/2004.05708

    摘要: 社區是社會網絡的重要特徵。本文的目的是提出一個數學模型來研究社會網絡中的社區結構。為此,我們考慮一種特殊情況的社會網絡,即信息網絡。我們假設有很多對獲取內容感興趣的主體。主體對他們感興趣的內容類型有所不同。主體的目標是形成社區,以最大程度地提高其獲取和產生內容的效用。我們使用這種模型來表徵在這種情況下作為納什均衡出現的社區的結構。本文介紹的工作將針對連續主體模型情況獲得的結果推廣到針對離散主體種群模型的情況。我們注意到,離散的主體集可以更準確地反映現實生活中的信息網絡,並且需要這些主體集才能獲得對社區結構的更多見解,例如社區內的連通性(圖結構)以及信息傳播在一個社區內。

    具有間接傳輸鏈接和有限聯繫信息的動態網絡上的疫苗接種策略

    原文標題: Vaccination strategies on dynamic networks with indirect transmission links and limited contact information

    地址: http://arxiv.org/abs/2004.05725

    作者: Md Shahzamal, Raja Jurdak, Bernard Mans, Frank de Hoog, Dean Paini

    摘要: 傳染病仍然是現代社會的主要全球負擔,每年造成1300萬人死亡。降低傳染病發病率和死亡率的一種方法是預防性接種或針對性接種。但是,當前的疫苗接種策略依賴於很難獲得且成本高昂的高度具體的個人聯繫信息,以便確定有影響力的散佈人員。當前的方法還僅關注個體之間的直接接觸以進行傳播,而忽略了間接傳播,在這種間接傳播中,病原體可以在一個感染的個體和一個易感個體之間傳播,這些個體在短時間內訪問同一位置而沒有相遇。本文提出了一種新穎的疫苗接種策略,該策略依賴於可以輕鬆而有效地收集的直接和間接的粗粒度聯繫信息。我們的策略不是跟蹤個人的確切接觸程度,而是使用人們訪問的地點的類型來估計個人的接觸程度範圍,同時考慮直接和間接接觸。我們進行了廣泛的模擬,以評估我們的策略與最新疫苗接種策略的效果。結果表明,在考慮間接鏈接時,我們的策略可達到與oracle方法相當的性能,並且優於所有現有策略。

    在線產品評論中檢測和鑑定極端主義評論者組

    原文標題: Detecting and Characterizing Extremist Reviewer Groups in Online Product Reviews

    地址: http://arxiv.org/abs/2004.05865

    作者: Viresh Gupta, Aayush Aggarwal, Tanmoy Chakraborty

    摘要: 在線市場經常以評論的形式見證垃圾評論。人們經常被僱傭來針對特定品牌,以通過撰寫高度正面或負面的評論來促進或阻礙它們。這通常是集體進行的。儘管以前的一些研究試圖識別和分析此類垃圾郵件群體,但很少有人探索發現那些針對整個品牌而不只是產品的群體。在本文中,我們從亞馬遜產品評論網站收集了評論,並手動標記了一組923個候選評論者組。使用頻繁的項目集挖掘對品牌相似性進行抽取,以便如果用戶已經相互查看了很多品牌(的產品),則將用戶聚集在一起。我們假設審閱者組的性質取決於特定於(組,品牌)對的8個特徵。我們開發了一種基於功能的監督模型,將候選群體歸類為極端主義實體。我們運行多個分類器,以根據該組用戶的評論對一個組進行分類,以確定該組是否顯示出肢體徵兆。基於三層Perceptron的分類器被證明是最好的分類器。我們將進一步詳細研究此類群體的行為,以更好地瞭解品牌級意見欺詐的動態。這些行為包括評分的一致性,評論情緒,已驗證的購買,評論日期和評論收到的有用票。令人驚訝的是,我們觀察到有許多經過驗證的審閱者顯示出極端的情緒,這在進一步的調查中導致了繞開現有機制來防止亞馬遜上出現非官方激勵措施的方法。

    通過延遲優化含時圖中的可達性集

    原文標題: Optimizing Reachability Sets in Temporal Graphs by Delaying

    地址: http://arxiv.org/abs/2004.05875

    作者: Argyrios Deligkas, Igor Potapov

    摘要: 含時圖是一種動態圖,其中為每個邊分配了一組整數時間標籤,這些標籤指示該邊在哪個離散時間步可用。在本文中,我們研究了時間標籤的更改(對應於邊可用性的延遲)如何影響給定來源的可達性集。關於時間可達性集的問題是由網絡流行病學中的含時圖的大量應用所激發的,其目的是最大程度地減少感染的傳播,並在製造網絡中安排供應網絡中的問題,其目的與最大化覆蓋率和生產率相反。我們介紹了針對可達性集的控制機制,該機制基於延遲時間事件的兩個自然操作,這些時間操作會嚴重影響這些事件的鏈。稱為合併的第一個操作是全局操作,並在整個網絡中同時將連續的時間標籤批處理在一起。這對應於將所有事件推遲到特定時間。第二,在圖的每個邊的時間標籤上施加獨立的延遲。對於合併操作,即全局鎖定效應,即使對於非常簡單的圖結構,我們也證明了針對幾個最小化和最大可達性目標的NP硬度結果。對於第二個操作,獨立延遲,我們證明了當允許的延遲數量有界時,最小化問題是NP難的。我們用多項式時間算法對此進行補充,以在無限制延遲的情況下最小化可到達性集。

    迴歸基礎:使用結構信息對科學文獻進行聚類

    原文標題: Return to basics: Clustering of scientific literature using structural information

    地址: http://arxiv.org/abs/2004.05904

    作者: Jinhyuk Yun, Sejung Ahn, June Young Lee

    摘要: 學者經常採用相關性度量來估計兩個不同項目(例如文檔,作者和機構)之間的相似性。此類相關性度量通常基於重疊參考( ie ,書目耦合)或引文( ie ,共引文),然後可以與聚類分析一起使用以找到研究領域之間的邊界。不幸的是,計算相關性度量值極具挑戰性,尤其是對於大量項目而言,因為計算複雜度大於線性。我們提出了一種識別研究前沿的替代方法,該方法使用了由相關性度量啟發的直接引用。我們的新穎方法只是將一個節點複製到兩個不同的節點:一個引用節點和一個引用節點。然後,我們將典型的聚類方法應用於修改後的網絡。引用節點的群集應模仿書目耦合相關性網絡中的節點,而被引用節點的群集應像同引用關係網絡中的節點一樣。在驗證測試中,我們提出的方法與基於常規相關性的方法具有高度的相似性。我們還發現,與基於自然語言處理的分類相似性方面,所提出方法的聚類結果優於傳統的基於相關性的度量。

    paper2repo:學術論文的GitHub存儲庫推薦

    原文標題: paper2repo: GitHub Repository Recommendation for Academic Papers

    地址: http://arxiv.org/abs/2004.06059

    作者: Huajie Shao, Dachun Sun, Jiahao Wu, Zecheng Zhang, Aston Zhang, Shuochao Yao, Shengzhong Liu, Tianshi Wang, Chao Zhang, Tarek Abdelzaher

    摘要: GitHub已成為流行的社交應用程序平臺,大量用戶在該平臺上發佈其開源項目。尤其是,越來越多的研究人員發佈與研究論文相關的源代碼存儲庫,以吸引更多的人關注他們的工作。受這一趨勢的激勵,我們描述了一種新穎的跨項目推薦器系統 paper2repo ,該系統在GitHub上推薦與學術搜索系統(如Microsoft Academic)中的給定論文相匹配的相關存儲庫。關鍵的挑戰是確定輸入論文及其在兩個平臺上的相關存儲庫 無人標籤的好處 之間的相似性。為此,paper2repo將文本編碼和約束圖卷積網絡(GCN)集成在一起,以自動學習並將論文和存儲庫的嵌入內容映射到同一空間,在此處鄰近度為推薦提供了基礎。為了使我們的方法在現實生活中的系統更加實用,用於模型訓練的標籤是根據GitHub上用戶操作的功能自動計算出來的。在機器學習中,這種自動標記通常被稱為 em distant monitoring。據作者所知,這是第一個遠程監督的跨平臺(紙張到存儲庫)匹配系統。我們根據從GitHub和Microsoft Academic收集的真實數據集評估paper2repo的性能。結果表明,它優於其他現有技術推薦方法。

    mFLICA:從時間序列推斷協調領導力的R包

    原文標題: mFLICA: An R package for Inferring Leadership of Coordination From Time Series

    地址: http://arxiv.org/abs/2004.06092

    作者: Chainarong Amornbunchornvej

    摘要: 領導力是領導者影響追隨者實現集體目標的過程。領導的特殊情況之一是協調模式的啟動。在這種情況下,領導者是發起者,他們發起每個人都遵循的協調模式。給定一組實數的個體-多元時間序列,mFLICA軟件包為R用戶提供了一個框架,以推斷時間序列內的協調事件,這些協調事件的發起者和關注者以及組合並和拆分的動態。 mFLICA軟件包還具有可視化功能,以使領導推理的結果更易於理解。該軟件包可在綜合R存檔網絡(CRAN)上找到,網址為https://CRAN.R-project.org/package=mFLICA。

    聲明:Arxiv文章摘要版權歸論文原作者所有,由本人進行翻譯整理,未經同意請勿隨意轉載。本系列在公眾號“網絡科學研究速遞”和個人博客進行同步更新。

    Arxiv網絡科學論文摘要23篇(2020-04-14)


    分享到:


    相關文章: