主页 > imtoken新版本 > Vent:最大的在线文本、情感和社会关系数据集 | 16篇网络科学论文速递

Vent:最大的在线文本、情感和社会关系数据集 | 16篇网络科学论文速递

imtoken新版本 2023-03-05 07:23:17

比特币现金和比特币区别_比特币区块和比特币的区别_比特币文本

核心快递

大规模分享情绪:Vent 数据集

原标题:

大规模分享情绪:Vent 数据集

地址:

作者:

Nikolaos Lykousas、Costantinos Patsakis、Andreas Kaltenbrunner、Vicenç Gómez

摘要:社交媒体的持续和日益广泛的使用使得人类思想、观点和日常行为的表达以前所未有的规模公开。 我们展示了 Vent 数据集,这是迄今为止最大的文本、情感和社会关系注释数据集。 它包含来自近 100 万用户及其社交关系的超过 3300 万条帖子。 每个帖子都有相关的情感。 有 63 种不同的情绪,分为 63 个“情绪类别”,产生两级影响分类。 我们最初的统计分析描述了 Vent 平台中的全球活动模式,揭示了巨大的异质性以及关于使用不同情绪的一些显着规律性。

我们专注于情绪、时间活动和用户社交网络的综合使用,并概述了根据用户活动推断情绪网络的可能方法。 我们还分析文本并描述 Vent 的情感景观,在情感类别和正/负效价方面与现有(小规模)带注释的语料库达成一致。 最后,我们讨论了可以从这个独特的数据集中解决的可能的研究问题。

层退化触发多路网络中的结构突变

原标题:

层退化触发多路复用网络中的突然结构转变

地址:

作者:

Emanuele Cozzo、Guilherme Ferraz de Arruda、Francisco A. Rodrigues、Yamir Moreno

摘要:从理论和实践的角度来看,网络鲁棒性都是网络科学的中心点。 在本文中,我们展示了层退化,理解为链接权重的连续或离散损失,触发了图代数连通性的突然变化所揭示的结构转换。 与传统的单层网络不同,多路复用网络分为两个阶段,一个阶段保护系统免受某些层的链路故障,另一个阶段所有系统检测故障发生在单层。 层。

我们还给出了重叠连续层退化位移的层内链路权重的精确临界值,它与层间耦合的值有关。 这种关系使我们能够揭示在层下退化时观察到的转变与在层间耦合变化下观察到的转变之间的联系。

BoostNet:社交机器人的 Bootstrap 检测,以危地马拉为例

原标题:

BoostNet:社交机器人的自举检测,以及来自危地马拉的案例研究

地址:

作者:

EI Velazquez Richards、E. Gallagher、P. Suárez-Serrato

摘要:我们提出了一种在给定最小输入的情况下重建社交机器人网络的方法。 然后,我们使用来自 47,000 个社交网络帐户的 Botometer 分数的核密度估计来查找自动帐户集群,找到超过 5,000 个社交机器人。 这种统计和数据驱动的方法允许推断社交机器人检测的阈值,如我们在危地马拉提出的案例研究所示。

比特币现金和比特币区别_比特币区块和比特币的区别_比特币文本

一种测试网络结构假设的谱拒绝方法

原标题:

用于测试网络结构假设的谱拒绝

地址:

作者:

Mark D. Humphries、Javier A. Caballero、Mat Evans、Silvia Maggi、Abhinav Singh

摘要:发现现实世界网络中的结构需要一个合适的空模型来定义有意义结构的缺失。 在这里,我们引入了一种用于在网络和节点级别测试结构假设的谱方法,通过使用生成模型来估计指定空模型下的特征值分布。 在合成网络上,这种谱拒绝方法可以清晰地检测随机结构和社区结构之间的转换,恢复社区的数量和成员资格,并去除噪声节点。

在真实网络中,与传统的社区检测方法形成鲜明对比的是,频谱抑制可以找到很大一部分噪声节点或不偏离空模型的节点。 在所有分析中,我们发现空模型的选择可以强烈改变关于网络结构存在的结论。 因此,我们的频谱抑制方法是一种很有前途的方法,可以揭示现实世界网络中的结构或结构缺失。

使用量子硬件在符号图中进行多社区检测

原标题:

使用量子硬件在签名图中进行多社区检测

地址:

作者:

埃桑·扎赫内贾德、丹尼尔·克劳福德、克莱门斯·阿道夫斯、贾斯普雷特·S·欧贝罗伊

摘要:签名图是社交网络建模的主要工具。 它们可以使用带符号的边表示个体(即节点)之间的关系。 在签名图中寻找社区在许多领域都很重要,例如,有针对性的广告。 我们提出了一种算法来检测签名图中的多个社区。 我们的方法将多社区检测问题简化为二次二元无约束优化问题,并使用最先进的量子或经典优化器来找到每个人对特定社区的最佳分配。

比特币闪电网络拓扑分析

原标题:

比特币闪电网络拓扑分析

地址:

作者:

István András Seres、László Gulyás、Dániel A. Nagy、Peter Burcsi

摘要:比特币的闪电网络 (LN) 是比特币的可扩展性解决方案,允许以可忽略的费用发布交易并立即大规模结算。 为了使用闪电网络,资金需要锁定在比特币区块链(第 1 层)的支付通道中,以便随后在闪电网络(第 2 层)中使用。 闪电网络由许多支付通道组成,形成一个支付通道网络。

LN 的承诺是,相对较少的支付渠道已经使任何人都能够通过网络高效、安全和私密地路由支付。 在本文中,我们量化了 LN 的结构特性,并认为可以改进 LN 的当前拓扑特性以提高 LN 的安全性并使其发挥其真正的潜力。

国际作物贸易

网络:冲击和级联效应

比特币区块和比特币的区别_比特币文本_比特币现金和比特币区别

原标题:

国际作物贸易网络:冲击和级联的影响

地址:

作者:

丽贝卡·伯克霍尔兹,弗兰克·史怀哲

摘要:通过分析 21 个国家 176 个国家的可用粮农组织数据,我们发现玉米、大米、大豆和小麦的国际贸易日益复杂。 越来越多的国家在贸易或食品加工方面充当生产者或中间人。 因此,我们发现交易网络更容易因外部冲击而发生故障级联。 在我们的模型中,各国通过实施出口限制来弥补需求不足。 为了捕捉这些,我们为不同的作物和年份构建了高阶贸易依赖网络。 这些网络揭示了国家之间隐藏的依赖关系,并允许讨论政策影响。

效率聚类模型和加密货币市场的成熟时代

原标题:

效率的集群模式和加密货币市场的成熟

地址:

作者:

Higor YD Sigaki、Matjaz Perc、Haroldo V. Ribeiro

摘要:有效市场假说对金融交易和市场稳定具有深远的影响。 因此,加密货币是否具有信息效率已成为近期深入调查的主题。 在这里,我们使用排列熵和统计复杂性而不是价格对数回报的滑动时间窗口来量化 400 多种加密货币的动态效率。 我们认为加密货币在时间窗口内是有效的,因为这两种复杂性度量在统计上与随机混洗数据获得的值无法区分。 我们发现,在我们的研究中,37% 的加密货币在 80% 的时间内保持高效,而 20% 的加密货币在不到 20% 的时间内信息高效。 我们的结果还表明,效率与加密货币的市值无关。

随着时间的推移,对信息效率的动态分析揭示了一种集群模式,其中具有相似时间模式的不同加密货币形成四个集群,而且,每组中较年轻的代币似乎准备跟随其“长辈”的领导。 趋势。 因此,加密货币市场表现出对有效市场假设的高度遵守,尽管数据也表明数字货币的成熟在这方面仍在进行中。

打击暴力极端主义:一个数学模型

原标题:

打击暴力极端主义:一个数学模型

地址:

作者:

曼努埃莱桑托普雷特

摘要:激进化是人们采纳越来越极端的政治、社会或宗教意识形态的过程。 当激进化导致暴力时,激进思想就会成为对国家安全的威胁。 预防和去激进化计划是用于打击暴力极端主义的一系列战略的一部分,这些战略统称为打击暴力极端主义 (CVE)。 预防计划试图阻止激进化进程的发生和持续。 去激进化计划与暴力极端分子合作,试图改变他们的极端主义信仰和暴力行为,目的是让他们重新融入社会。

在这篇文章中,我们介绍了一个简单的隔间模型,适用于描述预防和去激进化计划。 预防措施通过包括疫苗接种隔间来建模,而停用过程通过包括治疗隔间来建模。 我们计算基本复制数 R _0 。 对于 R 0 1 ,系统有一个额外的“局部平衡”。 Lyapunov 函数用于证明,当 R_0>1 时,地方性平衡是全局渐近稳定的。

韩国国家R&D绩效评价体系的系统动力学分析

原标题:

韩国国家研发绩效测量系统的系统动力学分析

比特币现金和比特币区别_比特币文本_比特币区块和比特币的区别

地址:

作者:

尤泰浩、郑宇盛

摘要:同行评审是一种有用且强大的绩效评估过程。 在韩国,它需要提高研发绩效的质量,但文献计量评估和缺乏同行会产生相反的效果。 我们使用系统动力学来描述韩国研发性能测量系统和提高性能质量的方法。 为满足研发绩效质量要求,需要提高评估的公平性和质量。

由于研发项目和桑树工艺的专业化,减少了同行资源的规模,这对于获得公平和质量至关重要。 此外,缩短评价周期影响研发绩效质量,导致工作量增加,限制长期创新研发项目,降低评价质量。 以前的评估政策是为了微观控制研发活动,但增加同行池的规模和改变评估周期会改变评估的质量和公平性。

基于内容的个性化微博推荐比较分析[实验与分析]

原标题:

基于内容的个性化微博推荐比较分析[实验与分析]

地址:

作者:

Efi Karra Taniskidou、乔治·帕帕达基斯、乔治·詹纳科普洛斯、马诺利斯·库巴拉基斯

【摘要】:微博平台是一种流行的实时交流和信息共享方式。 它们涉及大量用户生成的内容,以至于用户遭受信息泛滥之苦。 为了解决这个问题,已经提出了许多推荐方法来根据用户的兴趣来组织用户收到的帖子。 基于内容的方法通常为每个用户建立一个基于文本的模型来捕捉她的品味,然后根据它们与该模型的相似性在她的时间线中对帖子进行排名。 虽然基于内容的方法引起了数据管理界的极大兴趣,但影响其性能的主要因素尚未得到全面评估。

它们是:(i)将非结构化文本转换为阐明其特征的结构化表示的表示模型,(ii)构成用户模型的微博帖子的来源,以及(iii)用户发布活动的类型。 为了弥合这一差距,我们系统地检查了 9 个最先进的表示模型以及 13 个表示源和 3 种用户类型在来自 Twitter 的大型真实数据集上的性能比特币文本,该数据集由 60 个用户组成。

我们还考虑了各种表示模型的 223 种合理配置,以评估其内部参数的稳健性。 为了便于解释我们的实验结果,我们引入了一种新的表示模型分类。 我们的分析为决定微博中基于内容的推荐性能的主要因素的性能和功能提供了新的见解。

Instagram 社交网络上品牌影响者匹配的机器学习技术

原标题:

Instagram 社交网络上用于品牌影响者配对的机器学习技术

地址:

作者:

泰勒·斯威特、奥斯汀·罗斯韦尔、旋罗

摘要:社交媒体革命改变了品牌与消费者互动的方式。 越来越多的公司不再将广告预算花在州际广告牌上,而是选择与所谓的互联网“影响者”合作,这些人因发布高质量的内容而在在线平台上获得忠实的追随者。 不幸的是,对于小品牌来说,找到合适的影响者并不总是那么容易:与他们的企业形象一致但还不够受欢迎以至于不会成为负担的人。

在本文中,我们寻求开发一种品牌影响力匹配系统,以利用现代机器学习技术的强大功能和灵活性。 结果是一种算法可以根据他们发布的内容的相似性预测最有成效的品牌影响者合作伙伴关系。

基于局部边的加权标签传播算法

原标题:

基于局部边介数的加权标签传播算法

比特币现金和比特币区别_比特币文本_比特币区块和比特币的区别

地址:

作者:

哈米德·沙赫里瓦里·乔根、阿里雷扎·巴盖里、梅萨姆·阿扎德

摘要:在复杂网络,尤其是社交网络中,网络可以被划分成不相交的分区,内部边的数量(同一分区中顶点之间的边与边之间的比率)很高。 通常,这些分区称为社区。 检测这些社区有助于数据科学家从图表中提取有意义的信息并对其进行分析。 在过去的几十年里,人们提出了各种算法来检测图中的社区,每种算法都从不同的角度审视这个问题。

然而,这些算法中的大多数具有显着的时间复杂性和昂贵的计算,这使得它们不适合检测具有数百万条边和节点的大型图中的社区。 在本文中,我们尝试通过使用边缘介数度量来改进标签传播算法,以便它可以在接近线性的时间复杂度内以可接受的精度识别现实世界和人工网络中的不同社区。 此外,该算法可以检测加权图中的社区。 实证实验表明,该算法的精度和速度是可以接受的; 此外,所提出的算法是可扩展的。

州际战争的频率和严重性

原标题:

关于州际战争的频率和严重程度

地址:

作者:

亚伦·克劳塞特

摘要:刘易斯·弗莱·理查森 (Lewis Fry Richardson) 认为,从凶杀案到州际战争以及介于两者之间的一切,各种致命冲突的频率和严重程度都遵循一般统计模式:它们的频率遵循简单的泊松到达过程,而它们的严重程度遵循简单的幂法分配。 尽管他在 20 世纪中叶的方法和数据既不严谨也不全面比特币文本,但他对暴力冲突的见解一直存在。

在本章中,我们使用现代统计方法和数据证明理查森最初的主张在很大程度上是正确的,但有一些警告。 这些事实严重限制了我们对产生个别战争和和平时期的潜在机制的理解,并阐明了正在进行的关于冲突趋势的辩论。

超越均匀反采样:一种用于防止错误信息的混合采样技术

原标题:

超越均匀反向采样:一种用于防止错误信息的混合采样技术

地址:

作者:

Gunagmo Tong,Ding-Zhu Du

摘要:在线错误信息被认为是全球最大的风险之一,因为它可能导致经济损失和公众恐慌等严重后果。 错误信息预防问题旨在生成具有适当种子节点的正级联以与错误信息竞争。

在本文中,我们研究了突出的独立级联模型下的错误信息预防问题。 由于计算中的\#P-hardness影响,核心问题是设计有效的抽样方法来估计函数值。 本文的主要贡献是一种新颖的采样方法。 与平等处理所有节点和统一采样节点的经典反向采样技术不同,所提出的方法采用混合采样过程,能够为容易受到错误信息影响的用户赋予高权重。

因此,新的采样方法在生成用于计算正级联的种子节点的有效样本方面更加稳健。 基于新的混合样本技术,我们设计了一种提供 (1-1/e-epsilon) 近似值的算法。 我们在广泛的数据集上通过实验评估了所提出的方法,并表明它明显优于最先进的解决方案。

推特上的位置、职业和语义社会经济地位推断

原标题:

推特上基于位置、职业和语义的社会经济地位推断

比特币区块和比特币的区别_比特币现金和比特币区别_比特币文本

地址:

作者:

Jacobo Levy Abitbol、Marton Karsai、Eric Fleury

摘要:人们的社会经济地位取决于个人特征和环境变量的结合,使得从在线行为数据中推断成为一项艰巨的任务。 众所周知,社交网络中的通信、栖息地、职业或用户语义等属性是此功能的决定性预测因素。

在本文中,我们提出了三种不同的数据收集和组合方法,首先估计然后从他们的在线语义推断法国 Twitter 用户的社会经济地位。 我们的方法基于公开的人口普查数据、爬取的专业档案以及关于生活环境的遥感、专家注释信息。 我们的推理模型实现了与早期结果相似的性能,其优势在于依赖广泛可用的数据集,并提供了一个可通用的框架来估计大量 Twitter 用户的社会经济状况。 这些结果可能有助于社会分层和不平等的科学讨论,并可能推进一些应用。

来源:网络科学研究快报

编辑:孟洁

免责声明:Arxiv文章摘要版权归文章原作者所有,本人翻译。 未经同意请勿转载。 本系列在微信公众号“网络科学研究快车”(微信ID netsci)和个人博客(提供RSS订阅)同步更新。

近期网络科学论文速递

拉票时刻

《环球科学》杂志社及其公众号“科研圈”评选出“2018明星学术公众号”入围名单,同时也拉开了TOP 10评选的序幕。

,如果您喜欢极智社的内容,请长按识别下方二维码,或点击“阅读原文”为极智社投票,谢谢!

比特币现金和比特币区别_比特币文本_比特币区块和比特币的区别

无需注册,无需登录,无需个人信息

扫描二维码为极智投票(倒数第二行)

笔芯❤️

比特币文本_比特币现金和比特币区别_比特币区块和比特币的区别

集智俱乐部QQ群|877391004

商务合作及稿件转载|swarma@swarma.org

◆◆◆

搜索公众号:集智俱乐部

加入“无墙学院”

比特币现金和比特币区别_比特币区块和比特币的区别_比特币文本

让苹果更碎!

☟☟点击左下方|阅读原文| 给极智投一票!