想做好区块链数据剖析?先看看怎样处理“去匿名化”这个大困难_v比特币

作者 | 新缸中之脑 责编 |  Carol 泉源 | 区块链大本营(blockchain_camp) 在近来的集会演讲中我经常会被问到:区块链数据剖析的最大应战是什么?我的回覆就一个词: 去匿名化。 我坚定地以为,辨认差别范例的介入者并明白其行动是解锁区块链剖析潜力的中间应战。我们花费了相当多的时候来斟酌这个问题以辨认出与数字钱银活动的伦理不发生争执的准确边境。在这篇文章里,我想进一步讨论这个思绪。 市场上大多数区块链的架构依赖于匿名或伪匿名机制来庇护其节点的隐私并完成去中间化。数据殽杂机制能够将加密资产生意业务数据记录在公然的帐本上让每一个人都能接见,然则也让剖析这些数据变得非常难题。 假如不能辨认介入者的身份,就很难明白区块链数据集并剖析出有意义的结果,而且区块链剖析只能徜徉在初级阶段。但是,重要的一点是要明白,去匿名化区块链数据集并不是要知道帐本中每一个地点的实在身份,这个方向基本上是不具有可扩展性的大概。 相反的,我们能够辨认并明白区块链中已知介入者的行动,比方生意业务所、OTC柜台、矿工以及其他组成区块链生态系统的中间成员。   地点数目会不知不觉误导你   收集的量度是区块链剖析中无所不在的一个目标,也是一个能够清楚地展现去匿名化威力的目标。 地点数目是最常见的一个具有误导性的目标,由于并不是一切的地点都一致重要。生意业务建立的一个用于临时性转账的地点,明显不能和另一个历久持有资产的钱包地点等量齐观。 相似的,像币安如许的生意业务所的热钱包,肯定也差别和我的个人钱包采纳一样的要领和目标去剖析。一致对待一切地点的匿名性,注定会致使解读的有限性而且经常会得出误导性的结论。   匿名性 vs. 可解读性   匿名或伪匿名身份是可伸缩的去中间化架构的症结因素之一,然则这也让从区块链数据集合猎取有代价的信息变得极端难题。明白这一看法的一个方法,就是把匿名性视为区块链剖析的可解读性的一个反因子。 在区块链数据集合匿名性与可解读性之间的磨擦相对来讲还比较小。一个区块链数据集的匿名性越高,从中猎取有意义的信息的难度就越大。介入者的身份供应了其行动的高低文环境,而高低文环境则是可解读性的症结构建模块。 去匿名化 vs. 打标签 「你是什么」远比「你是谁」要重要。 去匿名化区块链数据集并不触及相识每一个介入者的实在身份。试图相识每一个用户的实在身份不仅是一个意义严重的使命,而且也会让剖析事情难以打破肯定的范围。 相反,

区块链观察:大公司的反面、DeFi和DAO

如果比特币最早起源于对银行的反抗,DeFi 则代表了对传统金融的不信任,DAO 则反应了对公司和中心化组织的另一种替代的寄予。

我们能够试着明白一个介入者的症结特征来让我们的剖析到达肯定水平的可解读性。因而,不须要清楚地辨认每一个地点的实在身份,我们能够给地点打标签或许附加一些描述性的元数据,来让其行动具有肯定的高低文环境。 在大范围数据中,打标签经常要比个别辨认更有结果。明白区块链生态系统中特定个别的行动当然会让剖析到达更个性化的水平,然则关于在宏观层面明白行动的趋向就显得相对受限了。 因而,相对与对区块链地点的个别实在身份的辨认,去匿名性的应战与地点的症结性属性的标注的关联更大。我们怎样完成这一点?   机械进修会是一个优异的解决方案   标注或许去匿名化区块链的思绪能够让区块链剖析更好地生态中已知介入者的行动形式和特征。直觉上我们能够斟酌建立一些划定规矩来剖析区块链生态系统中的差别成员,比方: “假如一个地点持有大批比特币地点而且一次实行100个生意业务,那末这是一个生意业务所地点……” 虽然很有吸引力,然则基于划定规矩的要领将很快失效,没法再供应有效的信息。下面列出了部份缘由: 预置学问的完整性:基于划定规矩的分类会假定我们关于怎样辨认区块链生态中的 差别介入者有充足的学问。这明显是不准确的假定。 延续的变化:区块链解决方案的架构一向都在演化,这对任何嵌入的划定规矩而言都是应战。 特征属性的数目:建立一条有两三个参数的划定规矩很简朴,然则试图建立一条有几十个以至上百个参数的划定规矩就没那末简朴了。要辨认出像生意业务所或OTC柜台如许的 地点须要大批的特征。 因而我们不能运用预置的划定规矩,我们须要一种能够从区块链数据集合进修形式的机制来自动推断出有意义的划定规矩让我们能够标注相干的介入方。从概念上来讲,这是一个典范的机械进修问题。 从机械进修的看法,我们应当从两个重要门路来斟酌应对去匿名化的应战: 无监视进修:无监视进修聚焦于进修指定数据集合存在的形式并辨认相干分组。在区块链数据集的高低文中,能够运用无监视进修模子基于地点的特征将其匹配到差别的分组中并对这些分组举行标注。 监视进修:监视进修要领能够应用已有的学问来进修指定数据集合的新的特征。在区块链高低文中,能够运用监视进修要领基于已有的生意业务所地点数据集练习一个模子来辨认出新的生意业务所地点。 去匿名化或许给区块链数据集打标签很少是只用监视进修或许只用非监视进修,更多的情况下须要两种要领的连系。机械进修模子能够有效地进修区块链生态系统中特定介入者的特征,并应用这些特征来明白其行动。 在运用区块链ETL东西将区块链原始数据加载到数据库或大数据剖析平台后,将标注层引入区块链数据集是举行更有代价的区块链数据剖析的一个症结应战。 这些标签供应了更好的高低文环境,也让区块链剖析模子具有更好的可解读性。不过只管我们有机械进修如许壮大的东西,去匿名性依然是剖析明白区块链生态系统的途径上一个不可无视的严重路障。

转载请注明:《想做好区块链数据剖析?先看看怎样处理“去匿名化”这个大困难_v比特币