你想知道如何在Web3中成为一名高效的数据分析师吗?还是,你只想构建一个Web3分析仪来对感兴趣的Web3数据感进行分析?不管怎样,欢迎你阅读本文。
作为一个数据人,Web3数据中最具挑战性的部分是理解数据本身。根据我的经验,有一件事让我觉得很容易,那就是把每个人都看作是一个巨大的数据仓库和以太坊区块链上面的协议,作为仓库中包含多个表和视图的各种模式。PS:这也适用于其他区块链。
对于这篇文章,我将努力使事情变得简洁,并使用这些主题突出它们:
Web3数据流和景观。了解Web3,去中心化的数据存储。用于解码交易数据的工具:与Web3数据栈一起的工具概述,以及如何利用它们让我们开始吧!
Web3的数据流和景观
Web3的关键在于变得更加独立和自主。这是通过区块链和分布式对等网络而不是服务器-客户端关系来实现的。这使得数据流和格式与我们在Web2中习惯的不同。通过研究,我发现了像DuneAnalytics和FlipsideCrypto这样的数据映射器,它们具有解码的区块链数据和内置的可视化工具,供对Web3感兴趣的数据科学家使用和构建。
上图:
https://docs.google.com/presentation/d/1I6vDOS52uMCmWg3KIbuKYe8lK-8_ol9bEksIUEHNNLI/edit#slide=id.gfac7071356_0_1
外媒:香港金融监管机构本周讨论了如何解决加密公司开设银行账户面临的挑战:6月16日消息,据彭博社援引知情人士报道,香港金融监管机构已于本周一召集银行、加密平台和其他行业参与者在一起,主要讨论如何解决加密公司在开设银行账户方面面临的持续挑战。这是香港监管机构自 4 月下旬以来第二次推动银行更多参与加密领域的会议。[2023/6/16 21:41:23]
上面的图片显示了从不同的区块链模式中提取数据进行分析的不同方式,在此以以太坊为例。
如果你曾经在以太坊上进行过交易,那么你可能已经在区块资源管理器上查找过它,并看到了这种信息:
通过Etherscan区块浏览器看到的以太坊区块链上的交易示例
学会阅读交易细节将是所有以太坊数据分析和知识的基础,但了解代币和交易数据的流向也很重要。
解读Web3数据
我可能偏向于使用以太坊区块链来解释解密区块链数据,但根据经验,当你了解数据在智能合约上的存储和管理方式时,以太坊更容易理解。既然如此,重要的是要注意,我将谈论的许多概念将广泛适用于所有与EVM兼容的链和智能合约,例如Polygon、FantomOpera、BSC、ArbitrumOne等。
一个智能合约交易相当于智能合约驱动的web3应用程序中的后台API调用。智能合约上的活动细节及其产生的应用状态变化被记录在称为交易、调用和日志的数据元素中。交易数据元素代表由用户发起的功能调用,调用数据元素代表智能合约在交易中发起的额外功能调用,而日志数据元素代表交易执行期间发生的事件。
摩根大通投资策略主席:不管比特币如何扩张,如何流行都不能让人感到满意:金色财经报道,金融巨头摩根大通投资策略主席Michael Cembalest在最近的一次采访中表示,他对比特币和加密货币的世界并不疯狂,暗示尽管比特币如何扩张,如何流行,但这种货币不会让所有人都感到满意。Cembalest 表示所表达的观点是他自己的观点,而不是摩根大通的观点。不喜欢世界排名第一的数字货币,原因有两个。首先是因为它的波动性,他说这阻止了比特币“进入与价值投资相一致的范围”。另一个原因是因为比特币并没有像许多分析师让我们相信的那样证明自己是对冲通胀的工具。(livebitcoinnews)[2022/2/14 9:49:52]
为了了解以太坊区块链上的交易数据,我们可以尝试使用Etherscan。这就像检查你的汽车仪表盘,以寻找修复汽车问题的指针,但作为一个数据科学家,我们必须打开汽车的引擎盖,了解幕后发生了什么。通常情况下,有3种不同类型的交易:
以基础货币的形式从一个用户转移到另一个用户,例如,张三在以太坊网络上给李四发送了3个ETH由一个EOA创建一个智能合约,例如,张三将代码提交给区块链上的一个地址,创建一个智能合约,一旦一定数量的资源被转移到卖方的账户,智能合约就会转移NFT的所有权。EOA对智能合约的调用,例如,张三调用李四的智能合约,用999ETH交换NFT。当用户在区块链上提出请求时,在引擎盖下发生的事情是:
直播|Higer :DeFi与ETH2.0如何引领下一个区块链时代?:金色财经 · 直播主办的金点Trend《2020 DeFi Dai飞吗?》马上开始!DeFi生态里,我们还应该狙击哪些项目?成长空间是多少?应该关注哪些风险?16:00准时开播!本场嘉宾来自区块链研习社的创始人Higer分享“DeFi与ETH2.0如何引领下一个区块链时代”,请扫码移步收听。[2020/7/31]
与用户相关的EOA发起一项交易,指定目标智能合约地址、目标功能、该功能的参数、交易付款以及它愿意支付的gas费用。该交易被广播到网络上,并由愿意执行目标智能合约中指定功能的矿工拾取。如果执行成功,智能合约会发出事件,标志着某些里程碑的完成。由此产生的事件数据结构被称为"日志"。目标智能合约可以向其他智能合约发起内部交易。这些内部事务创建的数据结构被称为"轨迹",也可能在各自的执行过程中发出额外的日志事件。
上图:代币传输的数据生命周期。来源:
https://docs.google.com/presentation/d/1I6vDOS52uMCmWg3KIbuKYe8lK-8_ol9bEksIUEHNNLI/edit#slide=id.gfac7071356_0_6
数据是如何结构化的
现场 | 火币集团COO朱嘉伟:区块链是解决三个和尚如何打水的问题:金色财经现场报道,百度智能云Techday11月21日在北京举行。火币集团COO朱嘉伟在会上表示,区块链技术和其他多数技术很不一样,多数技术是解决一个和尚如何打水的问题区块链是解决三个和尚如何打水的问题,因此区块链适用于多方协同的场景,可以促进数据共享、优化业务流程、降低运营成本、提升协同效率以及建设可信体系。[2019/11/21]
现在,你已经了解了发生在幕后的活动和相应的数据元素。现在是时候逐项列出构成web3景观的各种元素了。交易和跟踪数据结构包含了智能合约函数调用的细节,按照这个顺序:
在区块链上,每笔交易都有一个独特的哈希值`交易哈希值`,其中有各种交易细节。例如,我们可以在这里查询这个交易哈希值0xbe3b109b857e8897cbe3c2a261d8072546ae693662422a1b93fe1a3a990dfded`From`是交易的发送方,`To`是交易的接收方,也可以是一个合约地址。在这个例子中,它是从`0x83ebd57bf4f22cba9c4a624a69c910d7c8619ee2`转移到CROWDFUND_EDITIONS代币的。`Value`是被转移的ETH值。有时ETH值可以是0,在这种情况下,它是。`交易费用=交易使用的气体*气体价格`,你可以在这里找到更多与以太坊气体有关的细节。输入数据包含关于交易的额外信息。在这种情况下,它是一个转移函数,细节包括交易的地址和价值。
声音 | Flexa CEO:采用加密货币最大的障碍是如何找出可使普通人受益的项目:据LongHash消息,Flexa首席执行官Tyler Spalding就“采用加密货币最大的阻碍”相关话题表示:这在很大程度上与价格投机有关。大多数人仍然认为加密货币是纯粹的投资或投机性资产,在某些情况下确实如此。所以更大的问题是如何让普通人使用加密货币,从而使其从中受益?加密货币不是一项投资,也不是投机,这些东西确实会存在,但还有哪些项目是对普通人有意义的呢?这就是真正的障碍,需要找出这些部分是什么。[2019/6/2]
数据本身是字节码,在Dune上有数据类型`bytea`。前8个字符`0xa22cb465`是函数签名的`MethodId`,它不总是唯一的。之后的每64个字符是一个不同的输入变量。这里我们有两个,分别对应于`toaddress`和`value`。基于以上信息,我们可以使用以下查询来拉取Dune上的数据(
https://dune.xyz/queries/601249)——
访问和处理Web3数据的工具
现在我们已经很好地理解了Web3数据的元素,它看起来像什么,并且已经在区块链上查询了我们的第一个交易数据,你可能想知道如何快速熟悉一个协议及其数据。有一系列很好的工具可以帮助我们做到这一点。
BlockExplorers
如前所述,使用BlockExplorers是深入了解区块链上的交易的一个好方法。BlockExplorers是在线浏览器,可以显示区块链网络上曾经发生过的所有交易的细节。以上面的截图为例,重要的是要知道所有主要的区块链都有探索器--突出的例子包括Etherscan、Polygonscan、BSCScan、Solanabeach等。
尽管区块链探索者对于询问区块链账本内的单个记录很有帮助,但他们对于回答需要聚合或转换数据的问题并不擅长。例如,如果你想知道过去3个月有多少NFT通过Opensea交易所售出,或者如果有人想知道交易从"Coinbase"流向"AxieInfinity"的频率,只用区块探索器就很难回答。为此,人们将需要直接访问数据。这在我的上一篇文章中已经介绍过了(
https://thisgoke.medium.com/getting-into-web3-as-a-data-scientist-machine-learning-engineer-f77c450b4e83)。
分析数据
Duneanalytics是访问和分析区块链数据的一个伟大资源。在写这篇文章时,它有Ethereum、Solana、Xdai、Polygon、Optimism和BSC的原始和解码数据。它提供了一个PostgreSQL界面来查询数据集,以及一个简单的点选界面来在查询结果的基础上创建简单的仪表盘。Dune上的用户社区也相当活跃,并产生了一个广泛的查询和仪表盘的例子库,供人们学习。下面是在Dune上创建的几个分析实例
SolanaNFT交易概览OpenSea市场分析Eth2号流动性质押如果你对SQL完全陌生,我会推荐这些有用的Dune分析的提示和指南:
内联Ethereum地址。当在Dune中工作时,Ethereum地址被存储为PostgresSQL字节数,当你在Etherscan上查询时,它被编码为`x`前缀,而不是通常的`0x`。识别交易中的合约地址。当试图区分合约地址和普通地址时,你可以通过检查`CREATE`操作码是否在`traces`中被调用来实现,比如说
3.充分利用Dune上的标签。标签是一块关于地址的元数据,如果你愿意,是一个标签或元数据。它以键-值对的形式出现。键是标签类型,而值是标签名称。从本质上讲,你可以使用标签来查找地址,看看它们是什么。你可以在这里获得更多关于标签是什么以及如何使用它们的见解
https://docs.dune.xyz/data-tables/data-tables/labels#what-labels-looks-like
如果你想获取所查看地址的标签,请使用此UDF,你可以这样做;
4.表和列名的引号。PostgresSQL不能识别没有引号的骆驼字母的列和表名。因此,在Postgres中,双引号是为表和列保留的,而单引号是为值保留的,因此,如果你查询表名中的大写字母,Dune会抛出一个错误。
5.去除小数。在处理代币金额时,记得检查`erc20."tokens"`中的小数。
6.生成时间序列。当处理一个具有不连续时间序列的数据集时,使用
希望这是一篇有用的讨论文章,你已经知道了足够的知识来做基本的Web3数据探索和分析,使用Dune上的SQL,它看起来像什么,以及如何与它合作。在分析web3中的经济活动和用户行为时,重要的是要培养对特定智能合约工作方式的理解兴趣,这就会继续帮助你确定感兴趣的指标中涉及的关键功能和事件。
Web3正在经历快速发展和高变异,每天都有新的想法、产品、社区和实验涌现。它目前触及生活中的方方面面,包括但不限于支付、金融、艺术、音乐、游戏、社区、治理和身份,这使得任何人都能参与其中,令人兴奋。
所以请理解,结合实际使用Web3产品、检查Etherscan等区块浏览器上的数据耗尽情况以及阅读智能合约源代码,是制定正确的数据分析策略的关键必要条件。
标签:IOSTOST区块链MAKEiost币最新价格POST币区块链存证多少钱Make Cities Great Again
美国最大的加密货币交易所Coinbase推出了Web3应用程序功能,包括针对有限移动应用程序用户的热钱包和浏览器.
去年以来,数字藏品的火爆程度一路高涨,堪称收藏圈的奇迹。“上线秒光,一路陪跑”可以说是数字藏品市场的常态。对于收藏爱好者来说,收藏数字藏品主要是为了感受收藏本身的快乐.
2022年6月1日,日本头部合规交易平台HuobiJapan开始支持IOST的存提与交易。日本作为全球加密市场的重要组成部分,一向因以对加密项目监管严密而闻名于世界.
以下表达的内容均为作者个人观点,不应构成投资决策的依据,也不应解释为从事投资交易的推荐或建议。我们几乎无法控制人类为什么存在于这个宇宙.
2022年疫情卷土重来,全球超5亿人感染新冠病,超40亿人没有办法进行正常活动。核酸,封控几乎成了所有人的日常。疫情的全球蔓延使得很多国家的人际交往陷入困境,公民的日常交际行为受到限制.
电子商务巨头eBay正式推出了其首个NFT系列,一系列以美国国家冰球联盟(NHL)传奇人物WayneGretsky为主角的代币化收藏品于5月23日上线.