​如何使用星际文件传输网络(IPFS)搭建区块链服务(一)

qtum 发布在 区块链 1 12647

WechatIMG30

▪     分布式超媒体分发协议-IPFS  

▪    1. 简介

▪    2.使用IPFS

▪    2.1 安装 

▪    2.2 初始化

▪    2.3 加入IPFS网络

▪    2.4 获取内容

▪    2.5 发布内容

▪    2.6 缓存内容到本地 

▪    2.7 IPNS域名访问

▪    2.8 更多

▪     3. IPFS是如何工作

▪    3.1 身份验证

▪    3.2 网络

▪    3.3 路由

▪    3.4 块交换

▪    3.4.1 信用体系

▪    3.4.2 策略

▪    3.4.3 账单

▪    3.4.4 接口规范

▪    3.5 Merkle DAG

▪    3.6 文件系统

▪    3.6.1 blob

▪    3.6.2 list

▪    3.6.3 tree

▪    3.6.4 commit

▪    3.7 命名和可变状态

▪    3.7.1 自验证命名

▪    3.7.2 更加友好的命名方式

▪     4. 基于IPFS的应用

▪     5. IPFS与区块链技术的结合

 

1. 简介

IPFS(InterPlanetaryFile System)是一个点对点的分布式超媒体分发协议,它整合了过去几年最好的分布式系统思路,为所有人提供全球统一的可寻址空间,包括Git、自证明文件系统SFS、BitTorrent和DHT,同时也被认为是最有可能取代HTTP的新一代互联网协议。

IPFS用基于内容的寻址替代传统的基于域名的寻址,用户不需要关心服务器的位置,不用考虑文件存储的名字和路径。我们将一个文件放到IPFS节点中,将会得到基于其内容计算出的唯一加密哈希值。哈希值直接反映文件的内容,哪怕只修改1比特,哈希值也会完全不同。当IPFS被请求一个文件哈希时,它会使用一个分布式哈希表找到文件所在的节点,取回文件并验证文件数据。

IPFS是通用目的的基础架构,基本没有存储上的限制。大文件会被切分成小的分块,下载的时候可以从多个服务器同时获取。IPFS的网络是不固定的、细粒度的、分布式的网络,可以很好的适应内容分发网络的要求。这样的设计可以很好的共享各类数据,包括图像、视频流、分布式数据库、整个操作系统、模块链、8英寸软盘的备份,还有静态网站。

IPFS提供了一个友好的WEB访问接口,用户可以通过本机的 IPFS-HTTP 网关(http://localhost:5001/ipfs/) 或者公共的网关(http://ipfs.io/) 获取IPFS网络中的内容,也可以通过特定的浏览器或者插件通过ipfs:/or fs:/的方式直接获取内容。也许在不久的将来,IPFS协议将会彻底替代传统的HTTP协议。

 

2. 使用IPFS

2.1 安装

•$ go get -u -d github.com/ipfs/go-ipfs

•$ cd $GOPATH/src/github.com/ipfs/go-ipfs

•$ make install

2.2 初始化

$ ipfs init

2.3 加入IPFS网络

•$ ipfs daemon

2.4 获取内容

• $ipfs cat/ipfs/QmYwAPJzv5CZsnA625s3Xf2nemtYgPpHdWEz79ojWnPbdG/r   eadme

  •http://localhost:5001/ipfs/QmYwAPJzv5CZsnA625s3Xf2nemTYgPpHdWEz79ojWnPbdG

2.5 发布内容

$ ipfs add hello.jpg

  •   IPFS文件还可以抽象成特殊的IPFS目录,从而标注一个可读的文件名(透明的映射到IPFS哈希),在访问的时候会像HTTP一样获取一个目录索引。在IPFS上建立网站的流程和过去一样,而且把网站加入到IPFS节点的指令只需要一条指令:ipfs add -r yoursitedirectory

2.6 缓存内容到本地

   •$ ipfs pin add-r                       

    QmcKi2ae3uGb1kBg1yBpsuwoVqfmcByNdMiZ2pukxyLWD8

   •    缓存到本地的内容不仅可以自己使用,还能为其他节点提供资源

2.7 IPNS域名访问

   •    IPFS哈希只能用来表示不可变数据,因为一旦数据改变,哈希值也会改变。从某种意义上来说,这是保持数据持续性的好的设计。但是我们           也需要一种方法来标记最新更新网站的哈希,这个方法我们称作IPNS。

•    IPNS的原理是从域名的TXT记录里获取IPFS哈希地址,然后根据这个哈希地址从IPFS网络中获取数据。比如             http://ipfs.io/ipns/ipfs.git.sexy/

•    接下来IPFS还打算支持Namecoin。Namecoin从理论上完全实现了分布式Web的去中心化,整体的运行中不再需要中心化的授权。支持了Namecoin的IPFS不再需要ICANN、中心服务器,不受政治干涉,也无需授权证书。

2.8 更多

     •    更多信息请浏览IPFS的API文档https://ipfs.io/docs/api/

•    如果你想机遇IPFS做一些开发,这里有各种语言实现的API调用接口https://github.com/ipfs/ipfs#api-client-libraries

3. IPFS是如何工作的

3.1 身份验证

和比特币相似,每一个节点都会由NodeId(公钥的哈希值)来标识,节点存储着公钥和加密过的私钥。
首次连接时,节点间交换公钥,并检查 hash(other.PublicKey)是否等于other.NodeId。如果没有,则终止连接。

type NodeId Multihash

type Multihash []byte        

//self-describingcryptographic hash digest

 

type PublicKey []byte

type PrivateKey []byte

// self-describing keys

 

type Node struct {

    NodeId NodeID

 PubKey PublicKey

    PriKey PrivateKey

}

 

3.2 网络

每个节点与网络中的相连的其他数百个节点进行定期通信。
IPFS的网络传输具有如下特性:

• 传输: IPFS可以使用任何传输协议,如 WebRTC 和 uTP。

• 可靠性:如果底层网络不能保证可靠性,IPFS可以使用 uTP 或 SCTP 来保    证

• 连接:IPFS还使用 ICE NAT 穿越技术

•  完整性:使用哈希校验和检查消息的完整性。

•  真实性:可以使用发送者的公钥和HMAC来检查消息的真实性。

同时IPFS不仅仅是通过IP来连接节点,还支持很多其他协议。IPFS内部使用   不同的地址格式来选择不同的网络协议。

  # an SCTP/IPv4 connection

/ip4/10.20.30.40/sctp/1234/

 

# an SCTP/IPv4 connectionproxied over TCP/IPv4

/ip4/5.6.7.8/tcp/5678/ip4/1.2.3.4/sctp/1234/

 

 

3.3 路由

IPFS通过通过基于 S/Kademlia 和 Coral 的 DSHT 来寻找匹配的节点和特定节点的地址信息,IPFS的对象和使用模式的大小类似于 Coral 和 Mainline,因此 IPFS DHT 根据其大小对存储的值进行区分。小值(等于或小于1KB)直接存储在DHT上。对于更大的值,DHT存储拥有这些块的节点NodeId。
DSHT的接口定义如下:

typeIPFSRouting interface {

FindPeer(node NodeId)

// 得到指定节点的地址

 

SetValue(key[]bytes, value []bytes)

// 小值可直接存储在DHT上

 

GetValue(key[]bytes)

// 从DHT中获取值

 

ProvideValue(key Multihash)

// 宣布此节点可以提供一个大值

 

FindValuePeers(keyMultihash, min int)

// 得到拥有特定大值的所以节点

}

3.4 块交换

在IPFS中,通过使用 BitSwap 协议与其他节点进行块(block)交换来实现数据分发。
BitSwap 维持着两个列表,想要获得的块和已保存的块。但与 BitTorrent 不同的是,BitSwap 不限于一个torrent中的块。BitSwap 节点可以从整个IPFS网络获取所需的块,而不管这些块属于哪些文件,这大大提高了下载效率。
同时,网络中存在一些激励节点会主动缓存和传播稀有的文件片段。

3.4.1 信用体系

我们希望所有的节点都乐于分享他们拥有的块,但某些自私节点只从P2P网络中获取块,而从不做种。
IPFS使用了一套简单的信用系统来解决这个问题。

• 从其他节点获取块会产生“债务”,向其他节点发送块可以偿还“债务”

• 每个节点都记录与相连节点间的“债务”情况

•欠债越多的节点其优先级越低,如果一个节点只获取而从不奉献将会很快被    其他节点进行忽略超时操作。

3.4.2 策略

BitSwap 采用的不同策略对整体的演变表现有着非常不同的影响。
在 BitTorrent 中,虽然规定了标准策略,但是也已经实现了许多其他方法,从 BitTyrant (尽可能分享)到BitThief(利用漏洞并且永远不会分享),到 PropShare (按比例分享)。
我们需要的策略的目标应该是:

1.   最大化节点的交易性能和整体交换效率

2.   防止“吃白食”的情况发生

3.   有效抵抗其他未知策略

4.   对受信任的节点限制宽松

一种在实践中可行的策略是一个跟债务率挂钩的算法
节点的负债率 r = bytes_sent / (bytes_recv + 1)
发送率 P (send|r) = 1− 1/(1+exp(6−3r))
当节点的负债率超过已建立信用额度的两倍时,发送率迅速降低。

3.4.3 账单

BitSwap 节点维持与其他节点的传输计费账单,当节点间建立连接时,双方交换账单,如果账单不匹配,则清除已有账单,重新开始记账。当然,恶意节点可能会故意丢失账单,希望清除债务,其他节点可以将其视作不当行为,并拒绝。
账单的数据结构如下:

type Ledger struct {

owner      NodeId

partner    NodeId

bytes_sent int

bytes_recv int

timestamp  Timestamp

}

3.4.4 接口规范

// Additionalstate kept

type BitSwap struct{

ledgersmap[NodeId]Ledger

// Ledgers knownto this node, inc inactive

 

active map[NodeId]Peer

// currently openconnections to other nodes

 

need_list []Multihash

// checksums ofblocks this node needs

 

have_list[]Multihash

// checksums ofblocks this node has

}

 

type Peer struct {

nodeid NodeId

ledger Ledger

// Ledger between the node and this peer

 

last_seenTimestamp

// timestamp oflast received message

 

want_list[]Multihash

// checksums ofall blocks wanted by peer

// includes blocks wanted by peer’s peers

}

 

// Protocol interface:

interface Peer {

open (nodeid:NodeId, ledger :Ledger);

send_want_list(want_list :WantList);

send_block (block :Block) -> (complete :Bool);

close (final :Bool);

}

3.5 Merkle DAG

DHT 和 BitSwap 技术让 IPFS形成一个用于快速而强大的存储和分发块的 P2P 系统,。
在此之上,IPFS还构建了一种有向无环图 Merkle DAG,使用嵌入数据源中的目标哈希散列构建对象之间的链接。Merkle DAGs 为IPFS提供了许多有用的属性,包括:

1.内容寻址:所有内容(包括链接)都由其多哈希校验和进行唯一标识

2. 防篡改:所有内容都使用其校验和进行验证。如果数据被篡改或损坏,       则IPFS会检测到该数据。

3. 去冗余:所有内容完全相同的对象,只存储一次。这对索引对象特别有,     比如git tree和commits,或者是公共部分的数据。

IPFS对象的定义如下:

type IPFSLink struct{

Name string

// name or aliasof this link

 

Hash Multihash

// cryptographichash of target

 

Size int

// total size oftarget

}

 

type IPFSObject struct {

links []IPFSLink

// array of links

 

data []byte

// opaque contentdata

}

Merkle DAG 是一种非常灵活的数据存储方式,唯一的要求是 a) 使用内容寻址 b) 使用上述编码格式。

这使得我们可以用路径的方式访问对象, /ipfs/<hash-of-object>/<name-path-to-object>,如:/ipfs/XLYkgq61DYaQ8NhkcqyU7rLcnSa7dSHQ16x/test/foo.txt

3.6 文件系统

在 Merkle DAG 之上,IPFS还定义了一组对象用于对版本化文件系统进行建模。
这个对象模型类似于Git:

1.block: 可变大小的数据块。

2.list:块或其他列表的集合。

3.tree:块、列表或其他树的集合。

4.commit:树的版本历史中的快照。

3.6.1blob

blob 对象包含了可寻址的数据单元,表示一个文件。

{

“data”:”some data here”,

// blobs 是没有 link 的

}

一个IPFS文件由 blobs 和 lists 构成

3.6.2list

list 对象将很多去重的 blobs 连接到一起,包含了一组有序的 blob 或 list 对象。

{

    ”data”:["blob", "list", "blob"],

// 列表里的数据类型和links里面的一一对应

 

“links”: [

{"hash": "XLYkgq61DYaQ8NhkcqyU7rLcnSa7dSHQ16x",

"size": 189458},

{ "hash":"XLHBNmRQ5sJJrdMPuu48pzeyTtRo39tNDR5",

"size":19441 },

{ "hash":"XLWVQDqxo9Km9zLyquoC9gAP8CL1gWnHZ7z",

"size":5286 }

// listshave no names in links

]

}

3.6.3 tree

tree 对象代表一个路径,内容包括 blob、list、tree、commit,同时标记了对象的名称。

{

“data”: ["blob","list", "blob"],

// trees have anarray of object types as data

“links”:[

{ "hash":"XLYkgq61DYaQ8NhkcqyU7rLcnSa7dSHQ16x",

"name":"less", "size":189458 },

{ "hash":"XLHBNmRQ5sJJrdMPuu48pzeyTtRo39tNDR5",

"name":"script", "size":19441 },

{ "hash":"XLWVQDqxo9Km9zLyquoC9gAP8CL1gWnHZ7z",

"name": "template","size": 5286}

// treesdo have names

]

}

3.6.4commit

commit 对象代表对象的历史快照。

{

    ”data”: {

“type”:”tree”,

“date”:”2014-09-20 12:44:06Z”,

“message”:”This is a commit message.”

},

“links”: [

{ "hash":"XLa1qMBKiSEEDhojb9FFZ4tEvLf7FEQdhdU",

"name":"parent","size": 25309 },

{ "hash":"XLGw74KAy9junbh28x7ccWov9inu1Vo7pnX",

"name":"object", "size":5198 },

{ "hash":"XLF2ipQ4jD3UdeX5xp1KBgeHRhemUtaA8Vm",

"name":"author", "size":109 }

]

}

3.7 命名和可变状态

到目前为止,IPFS堆栈形成了构建内容寻址对象 DAG 的P2P交换。它可以用于发布和检索不可变的对象,甚至可以跟踪这些对象的版本历史。但是,仍缺少一个关键组件:可变命名。没有它,用户就得在IPFS系统外获取到新的内容地址了。

3.7.1 自验证命名

   1.   定义节点的NodeId为该节点公钥的哈希

2.   通过 /ipns/的方式可以访问该节点下的内容

3.   当其他节点从该节点获取文件时,可以验证其公钥和NodeId是否匹配

 

通过自验证命名,我们可以实现这样的访问效果
  /ipns/<NodeId>/docs/test.md而不必用/ipfs/<test.md’s Hash>这样的方式

3.7.2 更加友好的命名方式

自验证命名虽然解决了一些问题,但对用户来说还不够友好, IPFS提供了如下解决方案:

1. 节点链接

通过执行 ipfs link //friends/bob /

便可将 bob 节点链接到 alice 节点的 friends/bob 路径下,这样只需要知 道alice的地址就可以访问bob了

2.  域名访问

IPNS可以从域名的TXT记录里获取IPFS哈希地址,然后根据这个哈希地址从IPFS网络中获取数据

例如我们设置 ipfs.benet.ai 的TXT记录为”ipfs=XLF2ipQ4jD3U …”,

访问 /ipns/ipfs.benet.ai 便相当于 ipns/XLF2ipQ4jD3U …

3. Proquint可发音方案

IPNS支持将哈希地址译成可发音的单词

例如 /ipns/dahih-dolij-sozuk-vosah-luvar-fuluh

将解析为 /ipns/KhAwNprxYVxKqpDZ

 

4. 短地址服务

以shorten.er为例,用户可以获得一个指向特定地址的链接

例如 /ipns/shorten.er/foobar

将解析为 /ipns/XLF2ipQ4jD3UdeX5xp1KBgeHRhemUtaA8Vm

这时shorten.er就类似于我们今天使用的DNS服务器了。

4. 基于IPFS的应用

•    ipfs.pics - 免费的永久图床,上传和分享你的图片。

•    OrbitChat - 基于IPFS的去中心化聊天室,用户可以自由创建和加入channel并参与讨论。

•    Neocities - 免费帮助人们创作和发布网页的组织,将用户上传的网页永久存储在IPFS网络中,即使Neocities关闭了,人们仍然可以在IPFS网络中浏览到这些创作。

•    AKASHA - 基于IPFS和以太坊的下一代社交博客平台。

•    git-ipfs-rehost - 将你的git仓库托管在IPFS网络上。

•    GlobalUpload - 文件传输服务

•    IPFSSEARCH - 搜索IPFS网络中的内容

5. IPFS与区块链技术的结合

IPFS弥补了现有区块链系统在文件存储方面的短板,将IPFS的永久文件存储和区块链的不可篡改、时间戳证明特性结合,非常适合应用于保护版权、身份证明、来源证明等方面。
同时用基于区块链的代币来激励IPFS节点存储数据也是最好的选择。
在去中心化的世界里,QTUM智能合约提供各种逻辑服务,IPFS提供文件资源,两者结合,共同构建去中心化的网络世界。

 

发文时比特币价格 ¥7029.89
作者:QTUM-CodeFace(codeface@qtum.org)
稿源:巴比特资讯(http://www.8btc.com/ipfs)
版权声明: by nc" sa 作者保留权利。文章为作者独立观点,不代表巴比特立场。

评论:1

您需要登录后才可以回复 登录|注册

    IPFS用基于内容的寻址替代传统的基于域名的寻址,用户不需要关心服务器的位置,不用考虑文件存储的名字和路径。我们将一个文件放到IPFS节点中,将会得到基于其内容计算出的唯一加密哈希值。哈希值直接反映文件的内容,哪怕只修改1比特,哈希值也会完全不同。当IPFS被请求一个文件哈希时,它会使用一个分布式哈希表找到文件所在的节点,取回文件并验证文件数据。

    +1
    +1
    我要点评