朋友圈-码农街 - ZenCoderWu

开源中国-综合资讯 2024-01-31

开源日报：RISC-V 万兆开源交换机发售；npm 存在大量武林外传视频

欢迎阅读 OSCHINA 编辑部出品的开源日报，每天更新一期。 # 2024.1.30 今日要点 OpenSource Daily RWKV-5-World 7B 模型开源 —— 最环保、最节能的 AI 模型 2024 年 1 月 28 日，RWKV 开源基金会宣布开源 RWKV-5-World 7B 模型。据介绍，“RWKV-5-World 7B” 是 RWKV 第五代架构 7B 参数大模型，也是 RWKV 迄今为止多语言性能最强的开源大模型。根据性能评测数据显示，在 100% attention-free 和只训练 1.1T tokens 的前提下，RWKV-5 7B 模型的多语言性能超过 Mistral，英文性能看齐 LlaMa2。 Milk-V Vega: 全球首款 RISC-V 万兆开源交换机正式发售 MilkV 于去年 8 月亮相了 “全球首款开源万兆 RISC-V 网络交换机 Milk-V Vega”。时隔数月，该产品现已上架官方淘宝店开售，定价 799 元。据介绍，Milk-V Vega 是 Milk-V 面向新一代网络架构开发的一款小体积、高密度盒式开源万兆网络交换机，为用户提供宽带、语音、视频、监控等多业务统一承载平台，多网融合覆盖全业务；搭载国产 RISC-V 高可靠网络交换芯片，帮助企业与用户大幅简化网络架构，降低能耗成本与运维成本。 Milk-V Vega 支持完备的二层网络协议处理功能，包括 L2 桥接，L2 组播和风暴抑制等；支持基于流、端口、协议、子网的 VLAN 功能；支持 STP，RSTP 和 QinQ 功能；支持防 DOS 攻击，黑白名单和协议包滤除功能；支持滤镜，链路聚合，OAM 报文发送和端口保护功能；支持入口及出口的 ACL 功能，还支持同步以太网，1588 功能。 Meta 发布全新代码生成大模型 Code Llama 70...

知乎热榜 2024-01-31

如何看待博世高管说博世的优势华为无法比拟，没感觉到和华为之间有特别大的竞争压力？

现实主义理想者的回答大致看了下，我发现很多人可能对博世、华为乃至汽车行业的整体情况都有一定误解。最明显的一点在于，很多人貌似对传统燃油车时代的供应链体系有浪漫化的想象。但实际上，传统汽车强国日德各自都有一整套配套体系，整体供应链长期高度封闭。在日本本土，日系整车厂与供应商保持了高度的产业协同。仅仅丰田一家，就衍生出株式电装、爱信精机、丰田通商、爱知制钢、丰田车体、丰田纺织、丰田合成等等从事汽车产业链的子公司。德国这边其实也是一样的道理，大众的背后，是博世、大陆、采埃孚等等一批供应链巨头。你中有我，我中有你，犬牙交错，相互嵌套……日德整车厂与供应商仿佛一架机器上的齿轮，保持着高度配合协同。彼时国内供应链新兴企业看似面对的是庞大市场，实际上起步时期根本就拿不到海外主流品牌的订单，实质上被排斥在日德划定的小圈子之外。当年国内产业链能做的，主要是玻璃、轮胎这种相对独立的部件。一旦涉及到车辆控制和核心部件，哪怕国内产业链有性能或者价格上的优势，也几乎不可能借助日德整车厂的订单发展壮大。哪怕强如宁德时代，崛起初期也是拿到的自主品牌的订单。而燃油车时代我国下游自主品牌整体发展相对薄弱，更难以供养出上游的供应链企业，甚至很多时候反而不得不宣传采购博世等海外供应链来抬高身价。在燃油车时代，整体技术已经较为成熟，产品更新迭代往往保持着按部就班的节奏即可。日德整车厂与供应商长期延续统一的步调，每隔数年一次升级，舒服日子过惯了。整套产业链协同体系已经高度成熟，反应慢一些也无所谓。所以说在燃油车时代，日德产业链上下游垂直整合、高度协同的关系，有助于控制成本掌握利润，更有助于日德攫取更多利润、提供更多高端工作岗位。肥水不流外人田，说的就是这个道理。所以夸张一点说，汽车产业从来没有绝对意义上的全球化和自由贸易，有的只是“以我为主”、“为我所用”的全球化。然而近期的一...

知乎热榜 2024-01-31

弑母案吴谢宇今日被执行死刑，哪些信息值得关注？你对此案有哪些印象与评价？

同工Same的回答吴谢宇是目前在校生犯罪中，成绩最好的（北大经济），也是处罚最重的（死刑）。

知乎热榜 2024-01-31

李家超表示《基本法》第 23 条立法工作已经等了 26 年，香港等不起了，如何解读？哪些信息值得关注？

zhmzjqa的回答好，非常好，为了方便某些群体接受，建议直接照搬照抄英国的NSA（国家安全法案）。比如FIRS（外国影响力登记制度）就很好，只有涉及外国影响就要主动登记申报，不主动登记报告即构成刑事犯罪，当然，“外国影响”的定义权要属于内政部。还要学习英国立法缜密的精神，比如外国干预罪方面，对干预行为的定义包括“造成或威胁造成经济损失”或者“对他人造成精神伤害或施加精神压力”。直接物质和精神两手抓，滴水不漏，密不透风。这下不光是上街了，凡是和外国有点牵扯的人和组织，就是网上发发帖，也符合定罪条件，因为说不定你发的贴就伤害到哪个英国“小粉盎”的精神了哦。你把英国的国安法往乱港分子身上套，可以发现他们的行为哪个都逃不脱英国法律的手掌心，这种先进的法治建设成果值得我们学习。

*Java后端开发工程师薪资范围 20-45K * 岗位职责： 1、可独立完成需求的整理和软件架构设计 2、按照项目计划，按时提交高质量代码，完成开发任务 3、规范文档的编写、维护，以及其他与项目相关工作 4、负责后台系统的研发，及时解决项目涉及到的技术问题。岗位需求： 1. 本科及以上学历，计算机科学、软件工程或相关专业 2. 3 年以上 java 开发工作经验；有完整项目开

开源中国-综合资讯 2024-01-30

爆了！Sealos 三天支持 1000 个帕鲁私服

<div class="content"> <a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fhzh.sealos.run%2F%3Fopenapp%3Dsystem-template%253FtemplateName%253Dpalworld%2526uid%3Dkc811077" target="_blank">Sealos 的帕鲁私服模板</a>从第一天发布之后就起了 100 多个私服，第二天直接上到 500 多个，第三天直接上千，还在加速增长中。来讲讲我们只用一个晚上怎么做到上线一个专属可用区的，还有一些帕鲁实践让我对云有的一些新的思考。 <img src="https://oscimg.oschina.net/oscnet/up-490ea01e164188b5dfed8d0ca052a6ac442.jpg" alt="" referrerpolicy="no-referrer"> <h2>Sealos 凭啥杀出一条血路</h2> 这次各大云厂商都出了私服教程。 原因很简单，别的厂商都只是虚拟机上搭建的教程，有的甚至是长长的一篇文档，不过后来都搞一件部署了。 而 Sealos 直接做成了<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fsealos.run%2Fdocs%2Fguides%2Ftemplates%2F" target="_blank">应用模版</a>，点点鼠标，有手就会，对此菜市场大妈表示体验很好，边买菜都可以边部署起来。论速度我们吊打一切，只需要 30 秒起服，而其他我大部分测试了都要三分钟，原因很简单：我们抛弃了虚拟机。 玩游戏的很多人并非开发者，或者没那么懂技术的，虚拟机，控制台这些概念都不能让他们知道，就更别劝玩家去用了。Sealos 就是一个链接： <ul> <li><a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fhzh.sealos.run%2F%3Fopenapp%3Dsystem-template%253FtemplateName%253Dpalworld%2526uid%3Dkc811077" target="_blank">https://hzh.sealos.run/?openapp=system-template%3FtemplateName%3Dpalworld%26uid=kc811077</a></li> </ul> 看，有手就能部署，脑子都不用带。 我们的视频教程在 B 站获得了非常高的热度： <img src="https://oscimg.oschina.net/oscnet/up-e1ff512810d70062569e7e07974a64a1010.jpg" alt="" referrerpolicy="no-referrer"> 视频传送门： <ul> <li><a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fwww.bilibili.com%2Fvideo%2FBV1Tw41177n3" target="_blank">【幻兽帕鲁】零门槛服务器搭建配置存档教程免费体验</a></li> <li><a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fwww.bilibili.com%2Fvideo%2FBV1Ab4y1P7Es" target="_blank">【幻兽帕鲁】最小白的服务器搭建教程32人低延迟免费体验</a></li> </ul> Sealos 还可以先体验后付钱，付费转化率夸张的高！ 相比较包年包月，Sealos 采用完全按量计费的方式，玩家睡觉时就可以关了，收一点点磁盘的费用。容器还有个好处就是内存炸了很快就可以自动重启，几乎不影响用户体验，而虚拟机重启下不得分钟级。 还有就是调配置，<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fsealos.run%2Fdocs%2Fguides%2Fapplaunchpad%2Fautoscale" target="_blank">Sealos 随便伸缩</a>，虚拟机包年包月伸缩就很尴尬。 最后是一些细节体验，比如导入存档，配置管理，死亡不掉落等等。 还有一个要点，就是运营的同学要去玩游戏，为什么？如果我们不玩我们就无法体会死亡不掉落的重要性，无法体会孵蛋时间是个啥，无法理解用户在什么时间点会上头，这直接决定需要赠送多少额度，需要提供什么样的配置，需要新增什么样的痛点特性。 <h2>事情经过</h2> 有两个朋友给我发了这个游戏的文章，瞬间我就找到了我们 “奇技淫巧奖” 获得者的米开朗基杨同学，当天就把模版做出来了，上架到了我们的两个集群。随后文章一发，瞬间集群资源就满了。 <img src="https://oscimg.oschina.net/oscnet/up-e8607737eb52990918b33443b1aae7332a4.jpg" alt="" referrerpolicy="no-referrer"> 周四晚上我们立马决定建设一个新的专属可用区，这个可用区选择在阿里云上，原因很简单：需要快速扩容，而且以后可能热度下降要考虑释放问题。所以大家就不要随便黑公有云了，这是成本最低的打法，下文细讲。 我们一半人写代码，一半人买服务器起集群，把 Sealos 中玩家不需要的东西通通裁剪掉，应用市场也就只放一个模版，用 Laf 花了五分钟写一个游戏配置管理的程序并上线到 Sealos 上做默认应用。剩下的时间就在不断优化游戏的模版，包括缓存游戏的镜像让启动速度达到极致。 晚上就火爆了，不是在加服务器就是在加服务器的路上，我们每个节点可以跑 70 个私服。第二天团建，全员背着电脑，几乎一半人在烧烤一半人在支撑。 <img src="https://oscimg.oschina.net/oscnet/up-a3be78a611bf5d875e6a6ac46c8b5a66546.jpg" alt="" referrerpolicy="no-referrer"> 到目前为止单集群已经启动上千个。 <h2>帕鲁事件对云的思考</h2> 这个事只是一个影子，他映射出未来的云应该是什么样子。 <h3>第一：应用是一等公民，忘掉云原生，忘掉容器，更要忘掉虚拟机</h3> 你看安卓/iOS/Windows/macOS 以及各种 Linux 发行版，大部分用户用的是具体的应用，每个应用都有不同的用户画像，而很少有用户关心系统本身，更不会去关心内核。 把用户的最终需求直接给到用户才是云发展的终极目标，像帕鲁，用户需要的肯定不是容器，也不是虚拟机，那让用户进入到一个虚拟机的操作控制台显然就违背人性了。 当然会有很多开发者直接需要的就是虚拟机，那提供一个虚拟的应用也可以，核心逻辑解耦合，尽量不要让用户关心他需求以外的东西。随着应用的丰富，大众市场对更底层的需求就会越来越少，比如有了 RDS 之后，很多人要用数据库的人就不想去折腾虚拟机了，这里务必理解用户最终想要的是什么，直接给。 所以这必然会衍生出一种更合理的架构，其实这个架构已经有答案了，单机操作系统就是答案，有很好的标准，一堆人开发应用，另外一堆人使用应用，云为什么不这样？ 今天的公有云很多都被框死在了控制台，这样应用很难有自己的发挥空间，比如帕鲁的用户去登录公有云一通操作，VPC 快照对象存储几个标签就能把他看晕乎，这不是一种极致的产品体验。而手机上 LOL 游戏就不会外面套个微信的聊天框，不同的应用需要有自己不同的风格。markteplace 就更不用说了，缺乏标准，一锅大杂烩而已。 <h3>第二：云是连接应用的生产者与使用者</h3> 一旦云足够成熟的时候就会有非常好的灵活性，可以让大量开发者开发云上应用，使用者来使用，而今天云厂商大部分是厂商自己开发云产品，虽然也有第三方上架什么的，但是味道不对，怎么样算对，参考手机生态。 Docker Hub 就有点这个味道了，什么味道？标准的形成，很好的链接了镜像的制作者和使用者，但是提供的是零件，不是完整的分布式应用。 K8s 生态提供了很好的标准，是个非常优秀的云内核，一旦发行版盛行，此生态大成！那个时候很多人会忘掉 K8s，我可以给一个非常让人吃惊的数字，<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fsealos.run" target="_blank">Sealos</a> 云上的用户 80% 没接触过容器，20% 完全不是专业的开发者，他们就只想直接起应用。 所以先进的云需要给应用非常高的自由度，需要让用户用它的时候完全沉浸在应用本身的使用中，Sealos 就是这样，打开一个应用之后你就看不到 Sealos 的任何东西了，而目前云厂商都有个大大的 Header 和侧边栏，所以就出现了这种怪物： <img src="https://oscimg.oschina.net/oscnet/up-dff4b1c0b72679e2c0f1003dacad4c7f038.png" alt="" referrerpolicy="no-referrer"> 我想写代码，可是嵌套一层又一层。 云 IDE 应当是一个独立的应用，可能是第三方提供，然后别人来使用。即便是官方自研也应当是这样的架构。 <h3>第三：云是连接资源的提供者与消费者</h3> 现在的云厂商基本硬件资源都是自己提供，而 Sealos 的做法比较有意思，未来我们的很多 Region 算力本身也可以由第三方提供，接入到我们平台中，真正成为一个算力平台，从算力视角连接双方。有点像直营和加盟的意思，或者京东和淘宝。若无云操作系统，这种想法也无法落地，而我们 24 年就会提供。 <h3>第五：Sealos 公有云服务坚定选择云厂商，抛弃自托管硬件方向</h3> 自建还是选择公有云确实要看场景，Sealos 云服务的业务未来只考虑用公有云。不要只看到价格的贵而忽略效率成本，还有很多其它隐性成本不可不查。 帕鲁这个场景毫无疑问首选公有云，快速扩容这一个需求就决定了没法在自己的机房跑。而且热点过去了是要缩回来了。 即便不是帕鲁这个场景，Sealos 还是坚定不移用公有云，我曾经一直在摇摆自建还是上云，我们本身就是做云的，绝对有托管硬件自建的能力，物理机的性能也更好，单纯计算算力价格也低太多。 但是，最终发现需要花好多倍成本就解决那剩下 10% 的问题，比如高可用要备份，你的备份程序和磁盘都需要额外成本，对应人力成本也来了，最要命的是响应速度，换块盘也需要时间，需要沟通成本等等。这些公有云上一个快照就都可以解决。 还有个恶心的备案问题，几乎只能人肉迁移备案，开白名单这些。而且机房的带宽费用并不便宜。 买多少硬件资源也是一个很费事的问题，预留不够上架可就慢了。 综合下来如果你把云的弹性用好，是可以节省大量成本的。特别有状态和无状态分开运行，夜间释放，根据不同的 SLA 等级划分可用区，举个例子，我们可以针对开发测试场景专门做一个对接竞价实例的集群，把所有无状态全部用竞价去跑。 使用公有云还可以让我们自己保持轻资产运营，天下武功唯快不破，迭代速度是创业公司最为追求的。 </div>

开源中国-综合资讯 2024-01-30

CodeFuse 新开源模型荣登 Big Code 评测榜首！

<div class="content"> <div> <img alt="jahb.png" src="https://intranetproxy.alipay.com/skylark/lark/0/2024/png/98756342/1706606628857-bd1dbf7f-50d0-4b4e-a704-2f26ae5a3814.png?x-oss-process=image%2Fresize%2Cw_900%2Climit_0" width="900" referrerpolicy="no-referrer"> 使用多任务高效微调框架MFTCoder，以DeepSeek-Coder-33b模型为底座，微调获得的CodeFuse-DeepSeek-33b模型在Big Code Models Leaderboard代码大模型榜单上以43.58% WinRate成为新晋榜首，同时模型在NLP任务上也取得了很好的表现。本文我们将介绍该模型的得来和使用，包括训练数据、训练超参设置、模型评测效果以及如何获取该模型和基于它继续微调。我们已经在HuggingFace和ModelScope开放了模型下载（下载地址在文末），并同步提供了4bit量化版本供大家直接部署到生产环境。   <img src="https://intranetproxy.alipay.com/skylark/lark/0/2024/png/347737/1706581702847-565b14ab-7236-4bab-b74f-b8ce640e2eb9.png" width="1734" referrerpolicy="no-referrer"> 图1: Big Code Models LeaderBoard榜单截图（截取时间2024-01-30）。Big Code Models Leaderboard（<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fhuggingface.co%2Fspaces%2Fbigcode%2Fbigcode-models-leaderboard" target="_blank">https://huggingface.co/spaces/bigcode/bigcode-models-leaderboard</a>）是由HuggingFace BigCode团队维护的代码大模型榜单，是代码大模型领域比较权威的评测榜单。   <h1>多任务微调MFT</h1> 我们选择以DeepSeek-Coder-33b模型为底座，使用多任务微调框架MFTCoder对5个下游任务数据进行微调，得到CodeFuse-DeepSeek-33b模型。以下将更为详细地进行介绍。 <h2>训练数据</h2> 本次训练我们设置了5个下游任务，如下表1所示，包括代码补全任务、文本生成代码任务、单测生成任务、自然语言表述对齐任务和代码练习题任务，共约168万样本数据。得益于我们开源的多任务微调框架MFTCoder，这些下游任务能一定程度上相互促进，比直接将所有任务数据混合为一后微调表现更优。   表1: 下游任务训练数据统计 <table border="1" cellspacing="0" style="border-collapse:collapse; border:1px solid #d9d9d9; table-layout:fixed; width:700px"> <tbody> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 序号 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> MFT下游任务 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 任务能力 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> #Samples  </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 1 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 单测用例生成 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 给定函数级代码生成单元测试用例 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 390,393 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 2 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 代码补全 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 根据前文补全代码（方法级） </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 192,547 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 3 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 文本生成代码 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 基于文本描述生成功能代码 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 66,862 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 4 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> NLP表述对齐 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 增强NLP理解能力 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 951,278 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 5 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 代码练习题 (JAVA/CPP/GO) </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 基于文本描述生成基础功能代码 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 82,603 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> #Total </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 1,683,683 </td> </tr> </tbody> </table> <h2>关键超参设置</h2> 本次微调使用的是我们已经开源的多任务微调框架MFTCoder(<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fgithub.com%2Fcodefuse-ai%2FMFTCoder%2Ftree%2Fmain%2Fmftcoder_accelerate" target="_blank">https://github.com/codefuse-ai/MFTCoder/tree/main/mftcoder_accelerate</a>)，MFTCoder支持多模型适配（包括Llama 1/2、CodeLlama、Qwen、Baichuan 2、ChatGLM 2/3、CodeGeex 2、GPT-NEOX、Mistral、DeepSeek等）、多任务并行、多种均衡Loss设计、PEFT（Lora和QLora）高效微调，此前已被采纳为Qwen Code AI竞赛初赛推荐微调框架（<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Ftianchi.aliyun.com%2Fcompetition%2Fentrance%2F532169%2Finformation" target="_blank">https://tianchi.aliyun.com/competition/entrance/532169/information</a>）。本次训练使用的关键超参设置如下表2所示，更多详细的参数说明可参考<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fgithub.com%2Fcodefuse-ai%2FMFTCoder%2Ftree%2Fmain%2Fmft_peft_hf%2332-loraqlora" target="_blank">https://github.com/codefuse-ai/MFTCoder/tree/main/mft_peft_hf#32-loraqlora</a>   表2： MFTCoder微调关键超参设置及解释 <table border="1" cellspacing="0" style="border-collapse:collapse; border:1px solid #d9d9d9; table-layout:fixed; width:734px"> <tbody> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 参数名称 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 参数值 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 简要解释 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> data_split </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> "98,2,0" </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 98%数据用于训练，2%用于验证 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> padding_mode </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> "padding" </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 使用动态填充模式，即每张卡每个batch大小是由每次其中的最长者动态决定而不是固定大小。另一种可选数据模式是"pack"。 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:48px"> dynamic_padding </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:48px"> True </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> weighted_loss_mode </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> "case3" </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 使用数据均衡Loss函数，更多细节可见论文<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Farxiv.org%2Fabs%2F2311.02303" target="_blank">https://arxiv.org/abs/2311.02303</a> </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> peft_type </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> "qlora" </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 采取QLora 4bit量化微调模式 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> quantization </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> "4bit" </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> lora_rank </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 192 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 决定可训练参数比例 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> lora_alpha </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 32 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> per_device_train_batch_size </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 4 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 训练时单卡batch大小 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> per_device_eval_batch_size </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 4 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 验证时单卡batch大小 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> learning_rate </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 5e-5 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 初始学习率 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> min_lr </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 1e-6 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 最小学习率 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> gradient_accumulation_steps </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 1 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 梯度累积步数，如果为2，则每累积2步再更新参数，资源不足是一种间接增加global batch size的方式 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> world_size </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 64 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> GPU卡数，使用64张A100/A100卡 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> evalation_steps </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 500 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 每500步验证一次 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> checkpointing_steps </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 500 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 每500步保存一次检查点 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> num_train_epochs </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 10 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 最大训练轮数，最大10轮 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> early_stopping </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> True </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 开启early-stopping机制，即当连续3个检查点的eval loss均比倒数第4个检查点的eval loss大时终止训练 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> early_stopping_stall_num </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 3 </td> </tr> </tbody> </table>   使用前述训练数据和配置，经过156.5小时，模型在完成5.09 Epochs训练后触发Early-Stopping策略后终止。   <h1>模型效果</h1> 我们从代码能力和NLP能力两个方面对训练获得的CodeFuse-DeepSeek-33b进行了测试，pass@1测试均采用greedy解码模式（即doSample=False, num_beams=1, num_return_sequences=1）。 <h2>代码能力</h2> 我们选取了常用的代码评测集对模型进行评测，首先我们使用自己的CodeFuse-Evaluation评测框架（<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fgithub.com%2Fcodefuse-ai%2Fcodefuse-evaluation" target="_blank">https://github.com/codefuse-ai/codefuse-evaluation</a>）对模型在HumanEval-X（含HumanEval）和MBPP测试集上的表现进行了测试并与CodeFus此前微调过的模型进行了比较，如下表3和表4所示。 CodeFuse-DeepSeek-33b在HumanEval上pass@1指标值为78.65%、在MBPP上为71%（zero-shot），两项平均为74.83%，略高于DeepSeek-Coder-Instruct-33B。 CodeFuse-DeepSeek-33b在多语言评测集HumanEval-X上pass@1指标值平均为67.07%，比此前我们开放的CodeFuse-CodeLlama-34b模型高6.69%，在具体各种语言上高出3.48%~12.19%不等。   表3: CodeFuse-DeepSeek-33b模型与其他开源底座模型及微调模型在HumanEval和MBPP上的对比 <img src="https://intranetproxy.alipay.com/skylark/lark/0/2024/png/347737/1704200172671-e3b1411a-19eb-4305-878d-99f7f95945e5.png" width="636" referrerpolicy="no-referrer">   表4: CodeFuse-DeepSeek-33b模型与其他开源底座模型及MFT微调模型在HumanEval-X上的对比 <img src="https://intranetproxy.alipay.com/skylark/lark/0/2024/png/347737/1704200193212-a4061f95-d847-46d6-853b-2f0848c16050.png" width="719" referrerpolicy="no-referrer">   由于不同评测框架在代码后处理和生成终止条件（Stop Words）等方面常存在差异，除了用我们自己的CodeFuse-Evaluation评测框架，我们也用代码大模型榜单Big Code Models LeaderBoard所用的开源评测框架bigcode-evaluation-harness (<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fgithub.com%2Fbigcode-project%2Fbigcode-evaluation-harness" target="_blank">https://github.com/bigcode-project/bigcode-evaluation-harness</a>)进行了评测，并与榜单上的模型进行了比较。榜单会测试模型在Python代码补全测试集HumenEval和多语言代码补全测试集MultiPL-E共12种语言上的表现，并根据各语言表现进行WinRate排序。（结果复现代码地址：<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fgithub.com%2Ftwelveand0%2Fbigcode-evaluation-harness" target="_blank">https://github.com/twelveand0/bigcode-evaluation-harness</a>）   表5：采用bigcode-evaluation-harness评测CodeFuse-DeepSeek-33b模型后的新榜单<img src="https://intranetproxy.alipay.com/skylark/lark/0/2024/png/347737/1706582301694-43665f48-da68-422d-ad5a-86454c8f627f.png" width="1400" referrerpolicy="no-referrer">   如表5所示，CodeFuse-DeepSeek-33b模型的WinRate为43.58%，超过原榜首DeepSeek-Coder-33b-instruct。在HumanEval评测集上，CodeFuse-DeepSeek-33b表现不如DeepSeek-Coder-33b-instruct，但在其他8种语言（包括Java和JS等）上超过后者，均值（Average Score）亦超过后者1.7%。 <h2>NLP通用能力</h2> 对于NLP通用能力测试，我们参照OpenCompass选择了18个评测集，包括语言能力（AFQMC、CHID、Wic、WSC）、推理能力（COPA、CMNLI、OCNLI、Ax-b、Ax-g、RTE）、理解能力（CSL、C3、EPRSTMT）、学科综合能力（MMLU、C-Eval、ARC-c）、代码能力（HumanEval、MBPP）。对于每个模型，我们会使用生成式和PPL方式计算每个指标，并在每个维度上选取两种方式中较高的值作为指标值。 <img src="https://intranetproxy.alipay.com/skylark/lark/0/2024/png/347737/1704260089384-cb664a24-5d58-4a7d-9081-a61159a469e3.png" width="1230" referrerpolicy="no-referrer"> 图2: CodeFuse-DeepSeek-33b NLP通用能力雷达图   CodeFuse-DeepSeek-33b模型的评测结果如图3雷达图所示，我们将其与底座模型DeepSeek-Coder-33b和DeepSeek通用模型DeepSeek-67b-Chat进行了对比。从图中可以看出，相较于底座模型DeepSeek-Coder-33b，CodeFuse-DeepSeek-33b在所有维度上均有正向提升；相较于我们此前开源的CodeFuse-CodeLlama-34b，CodeFuse-DeepSeek-33b在绝大多数维度上表现更优；相较于通用模型DeepSeek-67b-Chat，CodeFuse-DeepSeek-33b在语言能力、代码能力和理解能力上整体表现更优，在推理能力上表现稍差，在学科综合能力上差距较大。考虑到模型参数规模差距和底座目标功能类型差异，我们认为CodeFuse-DeepSeek-33b已经表现很好。   <h1>模型INT4量化</h1> 为了便于直接部署投入生产，我们同步提供了CodeFuse-DeepSeek-33b-INT4量化版本。对于量化后的模型，我们测试了它的代码能力，如表5所示，量化后模型在代码补全任务上只有微弱降幅。   表5：模型量化前后在HumanEval-X和MBPP上的指标对比 <table border="1" cellspacing="0" style="border-collapse:collapse; border:1px solid #d9d9d9; table-layout:fixed; width:749px"> <tbody> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> Model </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> HumanEval-X </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> MBPP </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> Python </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> Java </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> C++ </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> JS </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> Go </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> CodeFuse-DeepSeek-33b </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 78.65% </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 67.68% </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 65.85% </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 67.07% </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 56.10% </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 71.0% </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> CodeFuse-DeepSeek-33b-INT4 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 78.05% </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 68.29% </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 62.19% </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 64.63% </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 55.49% </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> </td> </tr> </tbody> </table> 此外，我们测试了该模型实际部署后的性能。测试环境为单张A10（24G显存）、部署框架为NVIDIA开源的tensorRT。测试结果具体如表6所示：   表6: CodeFuse-DeepSeek-33b-INT4在单张A10的推理性能 <table border="1" cellspacing="0" style="border-collapse:collapse; border:1px solid #d9d9d9; table-layout:fixed; width:640px"> <tbody> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 模型版本 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> CodeFuse-DeepSeek-33b </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 推理速度指标 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> Tokens/s </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 模型并行/gpu型号 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px">   </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 单卡A10 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> 量化格式 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px">   </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> int4   </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px">   输入/输出长度 (batch_size=1) </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 16/8 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:37px"> 21.7 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:40px"> 64/32 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:40px"> 21.5 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:38px"> 256/128 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:38px"> 21.1 </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:36px"> 1024/512 </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:36px"> 20.5 </td> </tr> </tbody> </table> <h1> </h1> <h1>模型下载试用</h1> 我们开放了量化前后2个模型的下载，提供了推理格式和推理示例，并说明了如何在此基础上继续微调。 <h2>下载</h2> 我们已经将2个模型（CodeFuse-DeepSeek-33b和CodeFuse-DeepSeek-33b-INT4）发布到HuggingFace和ModelScope社区，大家可以选择通过以下链接下载： <table border="1" cellspacing="0" style="border-collapse:collapse; border:1px solid #d9d9d9; table-layout:fixed; width:726px"> <tbody> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> Model </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> HuggingFace </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> ModelScope </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> CodeFuse-DeepSeek-33b </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> <a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fhuggingface.co%2Fcodefuse-ai%2FCodeFuse-DeepSeek-33B" target="_blank">https://huggingface.co/codefuse-ai/CodeFuse-DeepSeek-33B</a> </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> <a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fmodelscope.cn%2Fmodels%2Fcodefuse-ai%2FCodeFuse-DeepSeek-33B%2Fsummary" target="_blank">https://modelscope.cn/models/codefuse-ai/CodeFuse-DeepSeek-33B/summary</a> </td> </tr> <tr> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> CodeFuse-DeepSeek-33b-4bits </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> <a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fhuggingface.co%2Fcodefuse-ai%2FCodeFuse-DeepSeek-33B-4bits" target="_blank">https://huggingface.co/codefuse-ai/CodeFuse-DeepSeek-33B-4bits</a> </td> <td style="border-color:#d9d9d9; border-style:solid; border-width:1px; height:33px"> <a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fmodelscope.cn%2Fmodels%2Fcodefuse-ai%2FCodeFuse-DeepSeek-33B-4bits%2Fsummary" target="_blank">https://modelscope.cn/models/codefuse-ai/CodeFuse-DeepSeek-33B-4bits/summary</a> </td> </tr> </tbody> </table> <h2>推理格式与代码</h2> CodeFuse-DeepSeek-33b使用的推理格式如下： <pre><code><s>system {THIS IS YOUR SYSTEM PROMPT} <s>human {THIS IS YOUR PROMPT of ROUND 1} <s>bot {THIS IS MODEL's RESPONSE of ROUND 1} <s>human {THIS IS YOUR PROMPT of ROUND 2} <s>bot</code></pre> 在这个格式中，sysem部分是可选的，对话轮数可以是多轮的也可以是单轮的。下面是一些具体的案例展示： <pre><code><s>human 请写一个快排程序 #Python <s>bot </code></pre> <pre><code><s>system 你是CodeFuse，你会被给定一个任务，你必须按照用户的要求完成任务。 <s>human 请写一个快排程序 #Python <s>bot 下面是一个使用Python编写的快速排序算法的示例代码： ```python def quick_sort(arr): if len(arr) <= 1: return arr pivot = arr[len(arr) // 2] left = [x for x in arr if x < pivot] middle = [x for x in arr if x == pivot] right = [x for x in arr if x > pivot] return quick_sort(left) + middle + quick_sort(right) # 测试快速排序算法 arr = [3, 6, 8, 10, 1, 2, 1] print(quick_sort(arr)) ``` 这段代码定义了一个`quick_sort`函数，它接受一个列表作为参数，并返回排序后的列表。在函数内部，首先判断列表的长度是否小于等于1，如果是，则直接返回列表本身。否则，选择列表中间的元素作为基准值，并将列表分成三个部分：小于基准值的部分、等于基准值的部分和大于基准值的部分。然后，对这三个部分分别递归调用`quick_sort`函数进行排序，最后将排序后的三个部分合并并返回。通过这个示例，你可以了解到如何使用Python编写快速排序算法，并对其进行测试。 <s>human 请为以上代码生成单测用例 <s>bot </code></pre>   下面是一段示例的推理代码： <pre><code>import torch from transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig model_dir = "codefuse-ai/CodeFuse-DeepSeek-33B" def load_model_tokenizer(model_path): tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True) tokenizer.eos_token = "<｜end▁of▁sentence｜>" tokenizer.pad_token = "<｜end▁of▁sentence｜>" tokenizer.eos_token_id = tokenizer.convert_tokens_to_ids(tokenizer.eos_token) tokenizer.pad_token_id = tokenizer.convert_tokens_to_ids(tokenizer.pad_token) tokenizer.padding_side = "left" model = AutoModelForCausalLM.from_pretrained(model_path, device_map='auto',torch_dtype=torch.bfloat16, trust_remote_code=True) return model, tokenizer HUMAN_ROLE_START_TAG = "<s>human\n" BOT_ROLE_START_TAG = "<s>bot\n" text_list = [f'{HUMAN_ROLE_START_TAG}Write a QuickSort program\n#Python\n{BOT_ROLE_START_TAG}'] model, tokenizer = load_model_tokenizer(model_dir) inputs = tokenizer(text_list, return_tensors='pt', padding=True, add_special_tokens=False).to('cuda') input_ids = inputs["input_ids"] attention_mask = inputs["attention_mask"] generation_config = GenerationConfig( eos_token_id=tokenizer.eos_token_id, pad_token_id=tokenizer.pad_token_id, temperature=0.1, max_new_tokens=512, num_return_sequences=1, num_beams=1, top_p=0.95, do_sample=False ) outputs = model.generate( inputs= input_ids, attention_mask=attention_mask, **generation_config.to_dict() ) gen_text = tokenizer.batch_decode(outputs[:, input_ids.shape[1]:], skip_special_tokens=True) print(gen_text[0])</code></pre> <h2>继续微调</h2> 如果你想在这两个模型基础上继续微调，欢迎使用我们开源的多任务高效微调框架MFTCoder（<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fgithub.com%2Fcodefuse-ai%2FMFTCoder%2Ftree%2Fmain%2Fmftcoder_accelerate" target="_blank">https://github.com/codefuse-ai/MFTCoder/tree/main/mftcoder_accelerate</a>）。要继续微调，你需要准备好训练数据集（CodeFuse-ChatML格式）、设置训练配置文件、设置运行配置文件并启动训练。这里提供一个对Qwen-1.8模型用MFTCoder进行微调的案例供参考：<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fgithub.com%2Fcodefuse-ai%2FMFTCoder%2Ftree%2Fcodeqwen_competition%2Fmft_peft_hf" target="_blank">https://github.com/codefuse-ai/MFTCoder/tree/codeqwen_competition/mft_peft_hf</a>。   <h1>联系我们</h1> MFTCoder已经开源，本文中提到的模型和数据集也在陆续开源中，如果您喜欢我们的工作，欢迎试用、指正错误和贡献代码，可以的话请给我们的项目增加Star以支持我们。 <ul> <li>GitHub项目主页：<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fgithub.com%2Fcodefuse-ai%2FMFTCoder" target="_blank">https://github.com/codefuse-ai/MFTCoder</a></li> <li>HuggingFace主页：<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fhuggingface.co%2Fcodefuse-ai" target="_blank">https://huggingface.co/codefuse-ai</a></li> <li>魔搭社区主页：<a href="https://www.oschina.net/action/GoToLink?url=https%3A%2F%2Fmodelscope.cn%2Forganization%2Fcodefuse-ai" target="_blank">https://modelscope.cn/organization/codefuse-ai</a></li> </ul> </div> </div>

<div class="content"> 最近，一个跟 AI 相关的案子引起了全国同行的围观，原因是一个百家号作者在网上写文章时，用了一张网上的 AI 图片当配图，结果被图片的生产者告侵权。这不禁让人紧张：以后 AI 产的图片，还能随便用吗？会不会侵权？ 事情是这样的—— 2023年2月，李昀锴使用 Stable Diffusion 模型，通过在模型上输入数十个提示词，设置相关迭代步数、图片高度、提示词引导系数以及随机数种子等，生成了数张人像图片。随后，李昀锴以 “春风送来了温柔” 为名发布在社交平台小红书上。2023年3月2日，百家号一自媒体账号发布的名为《三月的爱情，在桃花里》的文章使用了李昀锴制作的图片。 <img height="768" src="https://oscimg.oschina.net/oscnet/up-f6cf6dc908fcf7b1c685805400c6c984609.png" width="512" referrerpolicy="no-referrer"> 李昀锴用 Stable Diffusion 模型生成的图片 李昀锴认为，对方未获得他的许可就截掉了他在小红书平台的署名水印进行发布，侵犯了署名权及信息网络传播权，应当承担法律责任。 2023 年 5 月，李昀锴起诉被告刘某侵害作品署名权、信息网络传播权纠纷一案在北京互联网法院立案。 这里最关键的争议在于，李昀锴基于自己设定的提示词和参数，使用 Stable Diffusion 模型制作的图片 “春风送来了温柔” 是否构成作品？以及构成哪一种类型的作品？ 法院认为，原告李昀锴使用开源软件 Stable Diffusion 创作的图片由其独立完成，体现了他的个性化表达，因此涉案图片具备 “独创性” 要件。涉案图片符合作品的定义，属于美术作品，受到著作权法的保护。最终判决李昀锴胜诉，被告需在百家号平台公开道歉，并向原告赔偿 500 元。 这个案件，也成为了 AI 生成图片相关领域著作权第一案，让 AI 领域的从业者和使用者都提高了警惕： 原来 AI 创作的图片也是有著作权的，那以后使用 AI 图片还得注意授权问题了？ AI 图片很多都是用别人的图片“溶”出来的，相当于“二创”。这种做法放在文艺领域早被当成抄袭了，为啥它还能享有著作权呢？这是不是合理的？ 我用 AI 创作的图，总共有哪些权利和风险？权责如何划分？ 对此，我们邀请了知识产权领域的专业律师邓超进行对谈，一起聊聊究竟怎么回事。   <h1>01 AI 作品，版权并不明晰</h1> 开源中国：首先我们捋清一下概念，版权和著作权是一回事吗？   邓超：是的，著作权和版权没有区别。根据相关法律规定，著作权是指作品的作者等相关人员，依法对其已经完成的作品所享有的发表权、署名权、复制权、保护作品完整性权等。且著作权即版权。   开源中国：OK，那在现行法律当中，个人或单位使用 AI 生产的图片，拥有版权吗？   邓超：在现行法律当中，这块还没有明确规定，行业意见也不统一，需要进行个案分析。 前年北京互联网法院有一个“菲林诉百度案”，当时法院认为，机器生成的内容是没有版权的。 <img height="625" src="https://oscimg.oschina.net/oscnet/up-d4964bffd09758af1e3dbb525b78e0b065e.png" width="1421" referrerpolicy="no-referrer"> 但是在深圳的“腾讯新闻案”，法院则认为，机器生成的内容有版权。 <img height="687" src="https://oscimg.oschina.net/oscnet/up-9672009ee8539049d0417268a64ca6f9a30.png" width="1437" referrerpolicy="no-referrer"> 一南一北，对这个问题给出了不同的答案，但是这些案子都没有上诉，所以说现在还没有一个统一的意见。今天这个案子里，北京互联网法院就认为，AI 生成的图片是有版权的。但是，北京互联网法院它是个基层法院，判决的效力有限，不好说能不能全国推广。   开源中国：那 AI 生成的图片所拥有的权利很模糊啊？   邓超：也不能说很模糊，它有一个判断的过程。判决也强调了，利用人工智能生成的内容是否构成作品，需要视个案情况而定，不能一概而论。在这个案子里，这张图片的生成涉及了上百个提示词和参数的调整，在这种情况下，法院会认可这个创作者是付出了一定的创造性劳动的。相反，假设只是跟 AI 说“画一幅秋天的风景画”，那这个在我看来就不能有版权了，因为没付出什么符合著作权法要求的创作。   开源中国：可是，这些为创作而输出的参数和设定，多少算多，又多少算少呢？   邓超：是的，这里恰恰就是判断的难点，可能在每个案子里，每个法官的判断都会不一样。   开源中国：有律师认为，AI 作图跟传统的美术创作有很大的区别，原告只输出了提示词，并没有动笔去画具体的线条，也没有百分之百地告知 Stable Diffusion 模型怎样去画出具体的线条和色彩，就通过人工智能生成了图片。根据《著作权法》的传统理论，人创作的作品才受版权保护，原告李昀锴的行为并不构成创作。你怎么看？   邓超：是的，这种反对的观点还挺普遍。做个类比，我让一位画家画一幅秋天的风景画，但我不能在画家画完了之后说“我是这幅画的作者”。这是不合理的。 还有一种反对观点，它的逻辑是：即使我说了“画一幅秋天的风景画”这句话，不同的人他会画出不一样的东西，不能因为我说了这句指令，我就拥有了画的著作权，这是很奇怪的。像秋天的风景这种东西，本来就是一千个人一千种画法，即使是 AI ，不同的 AI 画出来的也不一样。甚至相同的 AI ，你让它再画一遍，都不一定画得出来。   开源中国：即使是相同的参数，它也不一定会生成同样的图。   邓超：是的，没错。但是这个类比，只能放在人身上，放在 AI 身上就不太一样，因为 AI 它是一个机器，不是具体的人，是没有权利的。如果这幅图是我让一个人来画的话，那著作权肯定就属于画画的那个人了。但 AI 它不是人，它没法成为作者。现阶段，生成式人工智能模型不具备自由意志，无论是国内还是国外，都不支持 AI 成为法律上的主体。 这也是法院在这个判决中做出的考量。目前来讲，无论是认为 AI 作品应该有版权还是不应该有版权，其实都能解释得通，因为 AI 这东西是新兴的，法律比较落后，现在还没有达成一致说这种情况应该怎么办？所以，法院现在判决的时候，更多是从产业或者立法目的的角度，去解释说：这 AI 是把它保护起来比较好，还是不保护更好？ 在这个案子里面，原告为了生成这张图片，输入了大量的指令，调整了上百个参数，如此正向反向的一系列约束下来，才得到这张图。这个过程，在法院看来，是有一定的独创性的。咱们国家法律规定的独创性很低。比如说摄影作品，摄影师等了一天安排了特定角度拍出来的图，大家会认为有独创性；但咱们普通人随便拍的图，一般来讲也是有独创性的，即使你没调参数，也没啥构思。所以说，独创性，这东西的门槛就很低，不需要达到什么专业高度就能拥有。   开源中国：可是拍照这事儿是我们自己动手拍的，不是别人告诉我怎么拍的。而且用 AI 的话，即使描述得再具体，它也只是文字创作，不是美术创作，它对于创作结果是不能预见也无法控制的，这与人们之前使用画笔、绘图软件去作图有很大的不同。它是“文生图”，不是“手作图”。   邓超：所以说，这里其实是一个价值取向的问题，给不给版权保护都说得通。 有一种反对观点认为，比如说“画一幅秋天的风景”这个指令，可以拥有文字性的版权，但这个文字性的版权，不能延伸到它生成的图片，不然以后所有的秋天风景画都侵犯了我的版权了，因为我最先说了这句指令。 不过，从历史的角度来看，各种形式的创作，要获得版权保护都是一个时间问题。比如说摄影技术刚诞生的时候，大家觉得摄影也不应该给版权，因为摄影出现之前，大家都是用油画，可能得花几十年学习，才能把风景画得很像。结果摄影技术出来之后，不需要任何绘画功底、也不用学几十年，只需按一下快门，就能得到一幅比你学了十几年画画还要接近真实的画，所以大家都认为它不是艺术，不应该给版权。可是后来你看，随着技术的发展，摄影慢慢地也成为一门艺术了。 从历史的视角来看，每当有新的事物出现，它总会面临一些争议，比方说要不要给版权？但是我们可以想办法把版权保护做得更好，在保障权利的同时适应新事物的出现。   <h1>02 新情况可以参照现有法律吗？</h1> 开源中国：现在有一种想法是将 AI 创作类比成互联网产品。比方说程序员在后台输入代码，通过计算机生成了一个 APP，生成了它的各种功能。但是代码不属于美术作品，谁来写都一样，能实现就行，同一个功能背后的代码可能是一模一样的。在 AI 创作中，提示词就相当于创作的“代码”，生成的图片就类似于前台的 APP，那这个提示词是不是也是谁来写都一样呢？还应该有版权吗？   邓超：在智力创作这一块，法律要求的门槛很低，毕加索的画有版权，小学生的画也一样有，并不以智力贡献的高低来衡量，只要是你写的就能有版权。 所以，代码也是可以享有版权的，像软件著作权登记，它登记的就是这个代码。如果你写了一个代码，别人抄袭你的代码，那也是构成著作权侵权的。只不过代码的著作权仅限于这个文字代码本身。 最开始，把代码当成文学小说来保护，也是有争议的。毕竟文字它没有任何实用的功能，但是代码，它唯一的目的就是实现功能。但是版权法不保护功能，要想保护功能可以用专利。所以最开始把代码视为文学小说就有这么一个不自洽的地方。那么法律后来就规定了，实现某个功能的唯一或者非常有限的代码，它是不能受版权保护的。比如说，单独写一个“弹出提示框”，仅仅这么一点东西，是没法被版权保护的。但要是整个程序，比如像微信，作为一个整体来讲，它就受到版权保护。 要是拿音乐来类比的话，单个音节，像 do、rei、mi、fa、so 本身是没法保护的，但是你把它编成一首曲子，那这首曲子就能受到版权保护。   开源中国：意思就是它得作为整体的一个作品来呈现才能算。   邓超：对。但是要说得呈现到啥程度，这其实并没有一个清晰的线。比方说一首歌算，那其中一段算不算呢？这就得到具体案件里面，进行具体分析了。   开源中国：人工智能的软件是可以大规模复制的，只要算力足够，短时间生成海量的图片完全没有问题。如果这都可以获得著作权保护，对整个社会而言，会不会起不到鼓励创新的效果？   邓超：是这样，现在从实践来讲，很多图片没法判断是不是 AI 生成的，除了那些手画不好的之外，其实很难分辨。在这种情况下，咱们默认所有图片都是有版权的就行了，不要在意它是不是 AI 生产的，这跟 AI 没关系。咱们在用图的时候，就两个原则：你独创的，或者是合法购买许可的，那就用；如果不是，那就别随便用。不能在网上看到一个图片就随手拿过来，这无论是不是 AI 生产的，风险都很大。 如果说我用 AI 大模型生成的图，跟别人生成的一样，比方说一样的提示词下 AI 给我们都出了一样的图，那也没关系，因为这是你独立创作的，就可以避免法律风险，哪怕对方来起诉也不怕。   开源中国：就是说我们用同一个 AI 同一套提示词生成的两张图，我们各自分别都有著作权，哪怕这两张图一模一样？   邓超：是的，因为咱们讲的是独创性，只要这是你独立完成的，那就没有问题。比如说，两个人同时拍天安门广场升旗的图片，可能俩人的角度非常像，拍出来的图片几乎一样，在这种情况下，各自都有著作权，没有任何人侵权。但如果真到了法庭那个阶段，你就得拿出证据证明这图确实是我拍的，不是我扒的。像这个案子里，被告把原告图片水印都截掉了，那肯定是在网络上扒的，肯定侵权。但如果被告的时候，能把原图或提示词都拿出来，证明确实能生成这图，那被告侵权就不成立了。   开源中国：但如果要重现的话，万一输入同样的提示词，AI 生成的图不一样，那不就没法自证了？   邓超：理论上是这样，但另一方面来看，这些图片侵权的案子，判赔额都很低，这个案子判赔500，其他案子更少，一般就几十块钱，风险很小。如果是自创图片的话，虽然不一定保留有创作过程，但肯定会留痕，实在不行还能找证人出庭作证，总之肯定能查清，所以对现状不会有什么颠覆性的影响。   <h1>03 AI 创作，风险大大的有</h1> 开源中国：说到独创性，目前很多的 AI 图片，都是用别人现有的图片“溶”出来的，这样也能算独创性吗？这不算抄袭吗？   邓超：当前刚好有一个案子：2023年12月27日，《纽约时报》起诉微软和 OpenAI，宣称报社数百万篇文章被用作 AI 的训练数据，这些数据的投喂到底是属于合理使用还是版权侵权，现在也没有定论，可以密切关注一下。 <blockquote> “合理使用原则”是指，虽然你的行为严格来说算侵权，但你的行为是一种可以接受的借用，用来促进创造性的表达。例如，学者可以在自己的作品中引用摘录他人内容；作者可以出版改编图书；普通人可以截取电影片段做影评。换句话说，如果对版权限制过死，文明的创造力将可能停滞。 科技公司长期利用这一原则来规避版权争议。2013年，谷歌因为复制数百万册图书并在线上传书里的片段，遭到作家协会的起诉，法官基于合理使用原则，裁决谷歌这一行为合法，因为它为公众创建了可搜索的索引，创造了公共价值。在大模型时代，合理使用原则仍可能发挥关键作用。支持 AI 不侵权的人认为，大模型生成内容的过程，跟人类创作相差无几——当你尝试画一幅画或拍一支视频，你的脑海里也会有你看过的画或电影。人类的创作在前人的基础上进步，大模型也是如此。 </blockquote> 现实总是领先法律一步：现实里出现问题了，法律再进行回应，现在刚好卡在了没达成一致意见的时候。 从本质上来讲，著作权法、知识产权法的目的都是为了促进社会的繁荣。像远古时代，没有什么知识产品，宋代印刷术出现之前，大家都是用手抄本，但大家都认为这是好事，可以防止文献失传。印刷术出现之后，才慢慢有了著作权。立法者认为，对作品作者给予一定保护，可以激发其他人创作出更多的作品来。现实也的确是这样，发达国家都有着非常完善的知识沉淀。所以本质来讲，还是看怎么选择更能促进产业和整个社会的发展。   开源中国：说到促进创作，这里我要讲一下，在美术界，相似度达到10%就属于抄袭了，但是 AI 现在是在不声明的情况下抄袭，并且不以任何代价使用，这不就跟促进创作的初衷刚好相反了？如果一做出来就会被抄袭，那不正好打击了人们创作的积极性，挤压人的创作空间吗？   邓超：对，是这样。任何一个东西，政策的影响都是两方面的，你说的是负面的一方。但从正面来讲，以前创作图片，需要美工先学十年美术，美工画一幅图要画一天。但现在，任何一个没有学过美术的人，也可以创作出一幅画了。从这方面来讲，生产力肯定是大大提高了，AI 一天生成的图就能顶100个美工的创作。当然，最后肯定还需要微调，但这生产率已经翻倍了。 假设现在一个公司需要100张图，如果找美工，成本是十万块钱；但找一个 AI 的话，可能就1000块钱，加上后期人工修改可能只需一万。从公司的角度来讲，它的成本就降低了，变得更有竞争力了，但背后可能就有十个美工失业了。可是从另外一个角度来讲，可能又会有十个 AI 相关的就业岗位增加。 所以 AI 这个东西，它就像蝴蝶效应一样，一个因素改变带来的社会变化非常复杂，有人受益，就会有人受损，所以这里很难预测，也不是我一个人能想明白的事。   开源中国：在风险这块，举个例子：假设我用 AI 做图的时候，只输了文字指令，但 AI 在训练的时候被喂了有版权的图片，所以产出给我的图片也侵权了，那是我负责还是 AI 公司负责？   邓超：按照咱们讨论的这个案子来讲，肯定是你负责，因为 AI 它只是一个工具，就跟画笔或者照相机一样，最后出问题可能还是得人来负责。除了我们刚才说的“纽约时报诉 OpenAI 案”，因为 OpenAI 是在训练的时候使用了纽约时报的内容，所以要 OpenAI 负责。但是现在 OpenAI 已经把产品软件提供出来了，你用这个 AI 软件生成的图片，如果侵权的话，（虽然现在还没有案例），AI 工具它大概率是没有责任的，责任在你。   开源中国：可是我本意没有想要侵权任何人，也不是我让这个 AI 去抄袭别人的，甚至我都不知道别人作品的存在，是 AI 公司训练的时候喂了有版权的图导致的生成作品侵权，这种情况我是没法控制的，也需要我来负责吗？   邓超：确实，你问的这三个问题，是 AI 时代最棘手的三个问题，现在都没有人有答案： 第一，大模型使用海量数据来进行训练，这种行为到底是侵权还是合理使用？ 第二，AI 生成的作品到底有没有版权？（今天讨论的这个案子里北京互联网法院已经初步给出了意见） 第三，用 AI 生成的作品侵权了究竟谁来承担责任？ 这三个问题现在没人能有答案，我刚才说的，只是我个人的观点。   开源中国：那意思就是说，有好处的话，是使用者获得，如果是风险的话，也是使用者承担。那 AI 公司它岂不是只负责赚钱不承担风险？   邓超：简单来说是这样，但具体的还得结合具体案情来讲。 企业的风险就是我们说的第一个问题：用别人的内容来训练 AI 模型，属不属于合理使用？这时候的政策是很敏感的。假设这算合理使用，企业风险很小，那一定程度上会促进 AI 产业的发展，因为企业没啥后顾之忧了；但如果让企业承担很大的责任，那一些刚发展起来的小公司搞不好会因为法律诉讼破产，这样就阻碍了行业发展。法律也好，判决也好，肯定都是要考虑产业发展的。   开源中国：但是也不能光揽好处，把风险甩给用户去跟原作者扯皮吧？   邓超：对，但是有人受益，肯定就有人受损，这个不太可能双赢，就看你价值取向更偏向谁。比如产业早期的时候，可能倾向于促进产业发展；等产业发展成熟了，公司壮大了，还一点责任都不承担就不太好了。不同阶段，产业政策不一样，法律方面的话，至少在我看来，裁判者也好，立法者也好，都是需要平衡的。   开源中国：伴随着人工智能、大语言模型的发展，AI 创作这种生产方式，还可能会触及哪些法律问题？   邓超：除了上面讲到的三点，还有就是可能会侵犯别人的肖像权，比方说生成的人像跟别人长得一样，可能就会侵犯肖像权，这也属于第三点中侵权的一种形式吧。   开源中国：法律届是怎么看待 AI 创作这一新的生产模式的？接下来会不会出台相关的法律法规呢？   邓超：按照过往的历史经验来看，不会这么早出台法律。以往像互联网之类的新事物，法律界都会先让子弹飞一会儿，先观察一阵，等到时机成熟了，再出台相关法律法规。另外，咱们现在的知识产权法的框架，足以解决目前跟 AI 相关的一些问题，还没有必要单独针对 AI 立一个法。可能等时机成熟了，会完善法律下面的一些解释或规定吧。 <hr> 对此，各位怎么看？你认为 AI 作品应该有版权吗？我们评论区见吧~ 本期嘉宾：邓超 | 律师（微信号：dengchao） <img height="560" src="https://oscimg.oschina.net/oscnet/up-0fa35e5b407c4ce45828bd4c6e0c8078989.png" width="400" referrerpolicy="no-referrer"> 具有理学学士和法学博士学位，有着深厚的法学理论基础；在知识产权行业从业十余年，有着丰富的实践经验。 长期专注于科技和媒体领域的知识产权前沿问题的研究和实践，代表客户处理相关的诉讼和非诉法律事务。 在进入律师事务所之前，曾就职于世界 500 强公司的法务部以及国内顶尖的知识产权事务所，为众多跨国公司、国内上市公司等提供知识产权法律服务。 </div>

知乎热榜 2024-01-30

如何看待董明珠宣布将多发2亿年终奖？

猿某人的回答 快谢谢妈！<figure data-size="normal"><img src="https://pic1.zhimg.com/v2-b5a49d98aedc7d4e4006751dadfbca28_1440w.jpg?source=b1748391" data-rawwidth="1028" data-rawheight="586" data-size="normal" data-original-token="v2-7b89dfb72159134e57cc9e04a9c900ea" data-default-watermark-src="https://pic1.zhimg.com/v2-6e213dc615372a106243d9299e0bba3c_720w.jpg?source=b1748391" class="origin_image zh-lightbox-thumb" data-original="https://pic1.zhimg.com/v2-b5a49d98aedc7d4e4006751dadfbca28_r.jpg?source=b1748391" referrerpolicy="no-referrer"></figure>两亿嘛，妈拿大头，小爸中头，其余小头。妈拿现金，其余人发点格力手机啥的，格力冰箱洗衣机券。

知乎热榜 2024-01-30

同事总是问我工资是多少，怎么回答呢？

HR大掌柜的回答 <h2>哈哈哈，找他借钱啊，多问他借几次。</h2><h3>相信我，解决这事情最好的办法就是：“用魔法打败魔法”。</h3>为什么这么讲呢？不论你透露出去的工资是高还是低都会对你不利。<h2>因为，在利益（钱）面前，不要去挑战人性。</h2><h2>所以，最好的回答是终结这个话题，并且化被动为主动。</h2><figure data-size="normal"><img src="https://picx.zhimg.com/v2-1c9aab0e1ef72497eff7b9affa0b4953_1440w.jpg?source=b1748391" data-caption="" data-size="normal" data-rawwidth="484" data-rawheight="387" data-original-token="v2-bce7093fafd1d3e7350017ccd61de3d8" data-default-watermark-src="https://picx.zhimg.com/v2-80208347858d78bd4cd85c2dc4a5f969_720w.jpg?source=b1748391" class="origin_image zh-lightbox-thumb" data-original="https://picx.zhimg.com/v2-1c9aab0e1ef72497eff7b9affa0b4953_r.jpg?source=b1748391" referrerpolicy="no-referrer"></figure>前几年在一线城市工作的时候，每年回老家过年：我家老爷子一定会对我千叮万嘱：人家问你工资你就可劲往低了说，然后有车贷、房贷；给邻居散烟散一般的就好不要整贵的。总之：在他们面前，你就是混的一般般。年轻那会，我不理解。有一次，我和太太闲谈时，她打趣的说到：我想回到过去过穷苦日子。之前大家虽然都很穷，但真正感觉到亲戚邻里间是互帮互助的，比如，“双抢”的时候帮七大姑八大姨家收水稻，帮邻居看个小孩、晒稻谷、收稻谷啥的……，现在生活的物质条件是越来越好了，日子越过越“火”了，关系却越来越淡了。我其实也是有同样的感触，却也百思不得其解。直到有一天我看到了一句话，我释然了：<h2>“他们可能希望你过的好，但并不希望（确切的说是不能接受）你比他过的好”！</h2><figure data-size="normal"><img src="https://picx.zhimg.com/v2-64f71add4b0f0ad08e02926de0244c78_1440w.jpg?source=b1748391" data-caption="" data-size="normal" data-rawwidth="464" data-rawheight="480" data-original-token="v2-07afb8782297e631f2d6c5dea74a9534" data-default-watermark-src="https://picx.zhimg.com/v2-c23379c3156c3584b7855740a509ec3f_720w.jpg?source=b1748391" class="origin_image zh-lightbox-thumb" data-original="https://picx.zhimg.com/v2-64f71add4b0f0ad08e02926de0244c78_r.jpg?source=b1748391" referrerpolicy="no-referrer"></figure>这就是人性啊。《资本论》中更是将利益面前的人性描绘的极致：适当的利润,资本就胆大起来；10%的利润，保证到处被使用；有20%的利润，它就活跃起来；有50%的利润，它就铤而走险；为了100%的利润，敢践踏一切人间法律；有300%的利润，它就敢犯任何罪行，甚至绞首的危险。所以，你觉得你和同事的关系是否比的过你和亲戚、邻居的关系？既然他都可以厚脸皮问这么多次，我还保持这份矜持干啥。大胆向他借钱啊。