如何用创新机器学习法,解决区块链数据分析挑战

如何用创新机器学习法,解决区块链数据分析挑战

头等仓 发布在 海盗号 18283

原文:Medium

翻译:头等仓(First.VIP)

编者注:原标题为《四种创新机器学习方法,助力解决区块链数据集分析挑战》

 

使用机器学习来分析区块链数据集是一个有趣的挑战,帮助我们发现和了解加密资产未知的巨大潜力,同时区块链数据集还给机器学习从业人员带来了非常独特的挑战。许多挑战成为大多数传统机器学习技术的主要障碍,机器智能技术的迅速发展能够创建新颖的机器学习方法,这种方法非常适用于区块链数据集的分析。本篇文章将简要概述一下机器学习领域中的一些新颖想法,这些想法在分析区块链数据时会产生许多有趣的结果。

区块链数据集提供了与加密资产行为有关的独特数据,因此为应用机器学习方法提供了机会。我们可能认为区块链数据集是机器学习应用程序的天堂,但传统方法通常会遇到一些意想不到的挑战:

· 缺乏标签数据:区块链数据集中少量的标签数据可用于训练机器学习模型。

· 混淆数据:区块链充满了几乎无法分析的加密或混淆数据。

· 缺乏针对的基准模型:机器学习是所有基准模型与其他模型的基准。在很少有文件记录的模型可以产生可信结果的空间中,这会导致难度增大。

传统机器学习思想

传统的机器学习从业者将世界分为两种类型:

· 监督学习:监督学习的主管是人类,我们在学习中使用标记正确的数据来教导或训练机器,这意味着某些数据已经被正确答案标记了。

· 无监督学习:无监督学习是使用既未分类也未标记的信息来训练机器,并允许算法在无指导的情况下对信息进行操作。在这里,机器的任务是根据相似性,模式和差异对未分类的信息进行分组,而无需事先对数据进行训练。

在区块链数据集中,鉴于标记数据集的可用性有限,监督学习应用受到限制。无监督方法可能非常有效,但是在没有其他模型或基准可以比较的情况下很难判断其性能。

为了帮助改进区块链数据分析中的非监督和监督方法,尝试使用一些近年来在机器学习社区中引起广泛关注的新颖方法。

帮助我们了解区块链数据集的新机器学习方法

我们生活在机器学习研究和技术的黄金时代。如今,机器学习框架和平台正在迅速融合许多技术,这些技术可帮助实现超越传统监督和非监督方法的新功能,我们发现其中一些技术与区块链数据集的分析非常相关。

半监督学习(Semi-Supervised Learning)

半监督学习是近年来机器学习领域中备受关注的领域之一。从概念上讲,半监督学习是监督学习的一种转变,它结合了标记和未标记数据的数据集进行训练。半监督学习的原理是:在许多情况下,与完全监督的模型相比,通过监督学习的少量标记和监督学习的大量未标记数据可以提供更高的准确性。

在区块链分析中,可以使用半监督学习来训练模型,该模型可以对参与者(如交易所或钱包)进行分类,而无需依赖大型标签数据集进行训练。例如,分类器可以学习使用一些标记的地址来识别密码交换,并使用更大的未标记的地址池来扩展其知识。

转移学习(Transfer Learning)

转移学习是一种表示学习形式,其基础是通过重用先前任务中的知识来掌握新任务。传统学习是独立的,并且纯粹基于特定的任务,数据集并在其上训练单独的独立模型而发生,没有保留可以从一种模型转移到另一种模型的知识。在转移学习中,可以利用先前训练过的模型中的知识(比如特征)来训练新模型,甚至解决诸如为新任务缺少数据等问题!

当涉及区块链数据分析时,可以使用转移学习来建立模型,以概括先前任务中的知识。例如,识别异常的比特币转移的模型可以将其推广运用到以太坊上。

神经架构搜索(Neural Architecture Search)和自动学习(AutoML)

设计机器学习模型是一项很艰难的任务,通常要依赖于未经测试的数据科学家的经验。给定的机器学习问题可以有无数的解决方案,很难理解我们是否有正确的解决方案。如果我们可以使机器学习模型的设计成为机器学习问题怎么解决,将是另一种更好的方案。

神经体系结构搜索或自动学习是一种新颖的技术,目的是在使机器学习模型创建自动化,给定一个数据集,一系列优化指标以及时间或资源方面的一些约束,自动学习方法能够评估成千上万的神经网络体系结构并产生最佳结果。有效的数据科学团队可能能够针对给定的问题评估十二个模型,但自动学习方法可以在相对可管理的时间内快速搜索成千上万的体系结构。

在区块链数据集的上下文中,神经架构搜索和自动学习可以帮助我们针对给定场景评估大量模型。例如,我们可以设计数百种模型并提出更完善的架构,而不是设计用于预测外汇资金流量的特定神经网络。

元学习(Meta Learning)

可以将元学习简单定义为获得知识多功能性的能力。作为普通人,我们能够以最少的信息同时完成多项任务,可以通过查看单个物体的图片来识别一种新型物体,也可以学习复杂的多任务活动,例如一次汽车驾驶或开飞机。AI代理可以完成非常复杂的任务,但它们需要对任何子任务进行大量培训,并且在多任务处理方面仍然表现得令人难以置信。一种流行的元学习技术被称为“少拍学习”,它可以创建深度神经网络,该网络可以从模拟的简约数据集中学习,例如一个婴儿如何通过仅看一两张图片就能学会识别物体。

在区块链分析的背景下,我们可以使用元学习来重用模型,这些模型可以识别恶意传输等模式,以识别像支付交易之类的有用信息。

这些是一些新的机器学习方法,这些方法在分析区块链数据时会非常有用。随着加密分析空间的发展,产生有意义的情报来帮助我们理解加密资产的行为,其中一些技术的应用将从公开性练习变成必须进行的练习。

转载请保留版权信息,感谢阅读。

文章标签: 区块链
评论
登录 账号发表你的看法,还没有账号?立即免费 注册