返回第一百六十四章 二零二七  路大头首页

关灯 护眼     字体:

上一页 目录 下一页

使这个附加保护机制,免费用他们的算力,还把股权给收回来了?”

韩路一缓缓的点了点头。

赵文渊沉吟道:“这个恐怕不好做到呀。”

又想了一会儿,赵文渊开口道:“主要是不好举证,数据标注也没有追踪码,你说是他从你这偷的,他还说是他拾的呢,除非——”

“除非用水印。”韩路一说。

“嗯,常规的水印就是特殊字符和统计学水印。”赵文渊说完,突然注意到张彪在旁边拿着笔记本正在记录他和韩路一的谈话。

怎么,张彪对技术话题突然感兴趣了?

赵文渊讲题的瘾一下就上来了——这种好学的人才不能放过。

于是他解释道:“数字水印就像是数字资产的追踪码,可以证明一些数字资产的归属。”

“比如说不可见字符水印,就是在数据里面加入一些人看不见的字符,但是计算机可以读到。这样,如果有人偷走我们的数据,我们用计算机读出来,在特定的位置,含有那些特定的字符,就可以证明,这些数据就是从我们这儿偷走的。”

赵文渊把刚才韩路一用过的那张纸拉过来,在上面画了个简单的示意图。

“统计学水印要绕一些。比如说同一个意思有很多个词可以表达,我们提前在数据里把比例定死:'好看'和'漂亮'就按1:2出现。这种统计模式只要整个数据集都符合,那数据就是从我们这儿偷的。”

“现在不是讲课的时候,回来你和彪哥专门聊。”韩路一说,“文渊,你说的这些加水印的方法都比较常规,破解方法也不是什么秘密,我猜鼎盛既然敢偷,应该会处理好这些。”

“那怎么办?”

“我倒是有个想法,逻辑水印。以前应该没人尝试过。”韩路一说道,“他们可以改词,洗数据,但是只要模型一开口,就是铁证。”

“你是说……”赵文渊思考了一下,觉得自己摸着点头绪,“把标注所体现出的逻辑规则抽象出来,如果对方训练出来的模型,它的逻辑模式和我们的高度相似,就说明对方的标注和我们的标注高度相似。这就像是两个空间——逻辑空间和语义空间——建立了映射一样。”

韩路一回头看到张彪又陷入了迷茫的神情,给他打了个比方:“这就好像我们有个菜谱,他们偷走之后把菜谱重抄了一遍,甚至里面的一些无关紧要的配料都换了,但是一吃,味道一模一样,我们还是知道他们是抄我们的。”

张彪脸上露出了然的神色,把笔记记了下来。

“可是。”赵文渊又想了一下,“你怎么知道他们不会把逻辑也换掉呢?”

韩路一一笑:“我赌他们不会,他们既然来偷我们的数据,肯定是做的不如我们好。你要去抄学霸的答案,你敢改吗?”

赵文渊皱了皱眉头:“我可没抄过答案啊。”

韩路一一愣,连忙说:“我也没抄过。”

张彪在旁边没说话,倒是也没人问他。

“总之,这批标注数据我会分好类给你,里面的逻辑水印我来做——”

“等他们来。”

正事说完了,韩路一从沙发上站了起来。

“文渊,你这几天辛苦了,咱

章节内容不完整,请退出阅读模式查看完整内容!
『加入书签,方便阅读』

上一页 目录 下一页