<?xml version="1.0" encoding="UTF-8"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>我爱计算机视觉</title>
    <link>https://wechat2rss.xlab.app/feed/b81ffcfff1107b5265cd7e39de610dc7ca72caf4.xml</link>
    <description>探寻CV新知，发现AI价值&#xA;(wechat feed made by @ttttmr https://wechat2rss.xlab.app)</description>
    <managingEditor> (我爱计算机视觉)</managingEditor>
    <pubDate>Tue, 12 May 2026 18:33:50 +0800</pubDate>
    <lastBuildDate>Tue, 12 May 2026 18:33:50 +0800</lastBuildDate>
    <image>
      <url>https://wx.qlogo.cn/mmhead/Q3auHgzwzM6aYkwkiboia6lA9D7ANy49WBe9icxn5NQqJjvn4Pyntzvfw/0</url>
      <title>我爱计算机视觉</title>
      <link>https://wechat2rss.xlab.app/feed/b81ffcfff1107b5265cd7e39de610dc7ca72caf4.xml</link>
    </image>
    <item>
      <title>ICML 2026 上海AILab &amp; 北大提出图像保真度测评模型StableI2I</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659508&amp;idx=1&amp;sn=ad3f25fee643f8108d3c0e47edc48317</link>
      <description></description>
      <content:encoded><![CDATA[<p>原创 <span>52CV</span> <span>2026-05-12 18:33</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=e55e28cb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGW83iacdNO4gKOzcz593f6ezdQc91wsQhbZ6ibtN04OmloTr1uXZTvRYlFUyHZOvRcsalP6g0lzicibicTZjgwn1euPNxibiaUxQy7WHoc%2F0%3Fwx_fmt%3Djpeg"/></p>
  
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.2778649921507064" data-type="gif" data-w="637" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175845" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=542d8c5e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGW9SyaR8QJ3EicHhdB7t3UPHDXmTg93GiaADM9S8Jj3PaBNN6crwibqjIJMXcSGyMh4lc6y6iayRhU66ibIDLblUmHzxlOt6RlLZyhYY%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">尽管现在的有许多的图像编辑的评价指标和模型，但是这些方法更多关注的是指令是否跟随，在未编辑的区域并没有非常专业的评价。StableI2I因此弥补这个空白，我们主要从</span><font color="#0000FF"><b><span leaf="">语义、纹理和质量</span></b></font><span leaf="">三个大的方面出发评价内容的一致性。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175844" data-ratio="0.2222222222222222" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=1a9e080f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8nvmD67zJA8GPIEbNYHOQHE99rbicULgtfex21LfOQm0X4xibazYsVmoKpFcohlc2sMZJ0RwibKv24IBzRXnO5K2rpJLgMZgFqvs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">🌐 Project Page: <a href="https://henry-lee-real.github.io/StableI2I_Page/" target="_blank">https://henry-lee-real.github.io/StableI2I_Page/</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">💻 Code: <a href="https://github.com/Henry-Lee-real/StableI2I" target="_blank">https://github.com/Henry-Lee-real/StableI2I</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">📝 Paper: <a href="https://arxiv.org/pdf/2605.04453" target="_blank">https://arxiv.org/pdf/2605.04453</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">📊 Checkpoint &amp; Benchmark: <a href="https://huggingface.co/collections/lijiayangCS/stablei2i" target="_blank">https://huggingface.co/collections/lijiayangCS/stablei2i</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">🤗 HuggingFace Paper: <a href="https://huggingface.co/papers/2605.04453" target="_blank">https://huggingface.co/papers/2605.04453</a></span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">引言：更准确的保真度感知</span></span></h2><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="1.0244200244200243" data-type="png" data-w="819" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175846" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=87bbdf56&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicYc5nTChxJ0Ex9tId5J5l2Bn6Y9w8V7lZT4joNn9icYjzx5pD5Q7lXQ8jHtePrVv32nehXeCeFjeE9iaIGfVx8wT7rXQPpHlCM0%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">如图是一个图像编辑的结果，传统的图像评估指标大多关注的是质量，美学等维度。这些指标都是NR的指标，并不能很好的参考输入的图像。此外一些编辑类的评价指标如ImgEdit-Judge，更多关注的是编辑指令的一致性。而其中的一致性维度判断能力也较弱，并不能很好的发现像素级的内容变化。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">就如本图所示，可能GPT-Image-1的美学质量很高，但是它发生了内容的错误和重绘，StableI2I就能很好的判断这些内容。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">StableI2I-Bench：三位一体的评价体系</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">由于现在没有专业的评测数据，我们构建了StableI2I-Data和Bench。评估模型是否能合理的完成保真度评估任务。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 核心评估维度</span></span></h3><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><font color="#0000FF"><b><span leaf="">Semantic-level：</span></b></font><span leaf="">是否出现语义信息上的内容错误。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><font color="#0000FF"><b><span leaf="">Structure Level：</span></b></font><span leaf="">是否出现像素级别的内容重绘或者是纹理结构错位。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><font color="#0000FF"><b><span leaf="">Low-level Appearance：</span></b></font><span leaf="">处理后的图像相对于原图是否发生了质量上的退化。</span></p></li></ul><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 数据构建流水线</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">我们主要从图像编辑和图像恢复两个任务来构建数据集。</span></p><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><font color="#0000FF"><b><span leaf="">图像恢复：</span></b></font><span leaf="">我们设计错误放大的数据生成流程。具体而言，我们先对自然图像施加随机退化，再利用 GPT-5 提取原图内容描述并引入受控语义扰动，构造错误文本条件，以引导恢复模型产生语义漂移或内容错误样本。对于合成数据，我们基于已知错误语义使用 GPT-5 API 进行初步标注，并由人工筛选修正；真实恢复数据则采用完全人工标注。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><font color="#0000FF"><b><span leaf="">图像编辑：</span></b></font><span leaf="">由于编辑错误难以通过确定性规则构造，我们使用多种编辑指令和多个生成模型生成多样化编辑结果，以覆盖不同场景下的潜在保真度问题。所有编辑数据均由人工标注，主要关注非目标区域中的语义变化、结构错位、内容重绘以及低层外观退化。</span></p></li></ol><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.4166666666666667" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175847" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=6cb2ed43&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicye8oFsml19MFKS1S8gWmHUpCkTRrZlfsicJqArJEq39DqeK9JKPHzxdrhy9lreXUPJsr2y1Cj53ibqAdnxZxgur6CZyiaCM7BRY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><b><span leaf="">人工标注流程：</span></b></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">人工标注流程主要包括标注团队筛选、标注员培训、正式标注和质量验收四个阶段。首先，我们通过公开招标选择标注团队，并为三家候选公司分别提供每个任务 100 个样本及详细标注指南进行试标。根据试标准确率，我们选择表现最好的公司进行正式标注。正式标注前，所有标注员均接受视频培训，并在标注过程中通过共享文档实时记录和解答问题。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">正式标注采用交叉标注流程，包括一轮初始标注和后续审核。对于图像恢复数据，标注员主要判断 GPT-5 粗标结果是否正确，并使用三点尺度标注退化程度；对于图像编辑数据，标注员需要标注错误类型，必要时使用 bounding box 定位问题区域，并同样使用三点尺度标注退化程度。最终，我们获得了 </span><font color="#0000FF"><b><span leaf="">6,722 </span></b></font><span leaf="">条人工标注的图像恢复样本和 </span><font color="#0000FF"><b><span leaf="">4,839 </span></b></font><span leaf="">条图像编辑样本，验收阶段整体标注通过准确率达到 </span><font color="#0000FF"><b><span leaf="">94%</span></b></font><span leaf="">。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">StableI2I 模型训练</span></span></h2><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 训练数据类型</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">StableI2I-Train 主要包含四类训练数据：Free-form Descriptive、Binary &amp; Type QA、Multiple-choice QA 和 Open-ended QA。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.45555555555555555" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175848" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=3ee2cd27&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWic331sHfCZlF4mRSJIvSluAokYficUyNBSqQx94Afr3XTia1gqhVE4F7iak17iaSS3DT86wk4DSmiaS9fxFcuLCn2Vbp5BYbw958jKk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><font color="#0000FF"><b><span leaf="">Free-form Descriptive：</span></b></font><span leaf="">用于保持模型基础的视觉感知和描述能力。该类数据要求模型对图像内容进行自由形式的自然语言描述，主要来源于 ShareGPT4V 和 CapRL 等通用视觉问答数据，覆盖自然图像、AIGC 图像、表格以及多种 QA 风格。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><font color="#0000FF"><b><span leaf="">Binary &amp; Type QA：</span></b></font><span leaf="">用于训练模型进行标准化的错误判断。该类数据要求模型判断输出图像相较于输入图像是否存在保真度问题，并进一步给出错误类型，例如 Semantic Level、Structure Level 或 Low-level Appearance。其输出格式较为固定，便于后续训练和自动化评估。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><font color="#0000FF"><b><span leaf="">Multiple-choice QA：</span></b></font><span leaf="">用于提升模型细粒度内容理解和错误辨别能力。该类数据将人工标注的开放式错误描述转化为选择题形式，使模型在多个候选区域或错误类型中选择正确答案，从而增强模型对具体错误位置和错误内容的识别能力。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><font color="#0000FF"><b><span leaf="">Open-ended QA：</span></b></font><span leaf="">用于训练模型生成详细的错误分析。该类数据要求模型不仅判断是否存在问题，还需要以自然语言描述具体错误，并给出结构化的分析结果，例如指出哪些区域发生了语义变化、结构错位、内容重绘或低层外观退化。</span></p></li></ol><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 模型训练策略</span></span></h3><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.5101851851851852" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175849" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=bd59efe6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9c4gTGM8IshuibOrD5wibVicW9H8KbkGnjWwAw7DARbSzhpSo2UZLNl8Em2P8VqMEJUeZ87Es0rFOfj4gK464jSLlMIFQbbmLycg%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">StableI2I 采用多阶段训练策略。首先，我们基于 Qwen3VL-8B-Instruct 进行监督微调（SFT），训练数据包括 Free-form Descriptive、Multiple-choice QA 和 Binary &amp; Type QA，使模型具备基础的视觉感知能力、图像描述能力以及保真度错误判断能力。 随后，我们在 SFT 模型基础上引入强化学习训练，使用 GRPO 优化模型的泛化能力。对于 Multiple-choice QA，奖励主要根据模型是否选择正确选项来计算；对于 Binary &amp; Type QA，奖励同时考虑模型的 Yes/No 判断是否正确，以及预测的问题类型是否与标注一致。通过这一阶段，模型能够更稳定地判断不同类型的保真度错误。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">接着，我们使用强化学习后的模型对大规模未标注 I2I 数据进行自动标注，并借助 GPT-5 对明显错误样本进行过滤，同时将部分 Binary &amp; Type QA 数据进一步转化为 Open-ended QA 数据，生成包含 think 和 problem 字段的开放式错误分析样本。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">最后，我们将原始标注数据与新构建的数据合并，对 Qwen3VL-8B-Instruct 进行最终全量微调，得到 StableI2I。该训练流程同时提升了模型的感知理解能力、错误判断能力和开放式分析能力。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果与评价</span></span></h2><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 与现有MLLM对于保真度任务上的性能比较</span></span></h3><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.4101851851851852" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175853" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=6bf40440&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8gFLOvYTySk57NUR75ibPIYvDib3icofNvTj3ZTXZFh0lMn3iaZRs7tg2x8m4Sk9evL4u1ib0GPdurfibJCk0gce8FCTEod6zwTiboys%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">我们在 StableI2I-Bench 上对比了多个主流开源和闭源多模态大模型，包括 Qwen3VL、InternVL、Claude、Gemini、GPT-4o 和 GPT-5 等。实验结果表明，现有通用多模态模型虽然具备一定的图像理解能力，但在 I2I 保真度评估任务上仍然存在明显不足，尤其是在结构错位、内容重绘以及细粒度低层外观变化的判断上表现不稳定。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">相比之下，StableI2I 经过专门的 I2I 保真度数据训练后，在整体性能上显著优于其他模型。具体来看，StableI2I 在 Binary Accuracy 上达到 </span><font color="#0000FF"><b><span leaf="">89.10%</span></b></font><span leaf="">，高于 GPT-5 的 80.57% 和 Gemini-3-pro 的 82.28%；在更加严格、同时要求判断正确错误类型的 Strict Accuracy 上，StableI2I 达到 </span><font color="#0000FF"><b><span leaf="">83.00%</span></b></font><span leaf="">，明显高于 Gemini-3-pro 的 67.15%、Claude-Sonnet-4.5 的 63.37% 和 GPT-5 的 55.27%。这说明 StableI2I 不仅更擅长判断图像转换后是否存在问题，也更能准确识别问题属于语义、结构还是低层外观错误。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">总体而言，通用多模态模型更偏向高层语义理解，对于语义错误和明显低层退化有一定判断能力，但对 I2I 任务中特有的结构一致性、内容重绘和局部保真度问题仍然不够敏感。StableI2I 通过专门的数据构建和训练策略，显著提升了这类保真度错误的检测能力。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 现有生成模型的性能比较</span></span></h3><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.34074074074074073" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175851" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=bea989d8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibTPq0mqicgn6oZsO2SAXpncHJsvgKVLV4ibyrG2QAO2AXIIiamScBiaibJvnbSmdqGMTZ6wl9IMib2nwnrScxx0IRBhAMGkiczkHsPcY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">我们进一步使用 StableI2I 评估了多个主流图像编辑和图像恢复模型在实际 I2I 任务中的表现。评估对象包括开源模型，如 LuminaDiMOO、Flux.1-dev、OmniGen2、Bagel、Qwen-Image-Edit 系列，以及闭源模型，如 GPT-Image-1 和 Nano-Banana。评估任务覆盖图像编辑数据集 ImgEdit-Bench、GEdit-Bench，以及去噪、去模糊、去雨、去雾和曝光校正等图像恢复任务。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">具体评估方式是：对于每个样本，StableI2I 分别从语义、结构和低层外观三个维度判断输出图像是否存在保真度问题。如果 StableI2I 回答 “Yes”，表示该维度没有检测到明显问题；最终得分即为回答 “Yes” 的样本比例。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">实验结果表明，Bagel 和 Qwen-Image-Edit 系列整体保真度较好。大多数模型在语义层面表现尚可，说明它们通常能够保持主要物体和高层语义内容；但在结构层面表现明显较差，说明当前模型仍然容易破坏输入图像的布局、几何结构或细节对应关系。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">尤其是 Flux.1-dev 和 GPT-Image-1，在真实评估中容易出现严重的内容重绘，即虽然生成图像看起来合理，但原图的结构布局被大幅重新生成，导致结构保真度得分很低。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.6046296296296296" data-type="jpeg" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175850" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=f343cd5c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGW9ZvgYsZraOxGOTGAbn1EhxOFZNqxdibIe0a1xrq4KNtuWjuGnjSVPKdWXza9D0ydrP4z0iaDDkicRI3gibDGlKE9PlxpuRAJcWZoM%2F640%3Fwx_fmt%3Djpeg%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.2972222222222222" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175852" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=b8f0def2&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8aTWaHPXzNAbWSkJJibR7CQzSqJIhz4OYtibbic1ltBSY8Yq9iaLdLQrEX0OKoM1CqPLEq0licUNjicRv5PibF1A3MlGp9EU4D6pQPfg%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">总体来看，当前 I2I 生成模型的主要问题并不是完全不理解编辑或恢复任务，而是容易在完成任务的同时修改本应保持不变的区域。其中，内容重绘和结构不一致是最突出的保真度问题。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">结语</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">StableI2I 首次系统地从语义和像素级两个角度评估 I2I 任务中的保真度，判断生成结果是否正确保留了原图中应当保持的信息。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">同时，StableI2I-Bench 为多模态大模型提供了一个多图一致性评测基准，能够检验模型超越单图理解的细粒度感知能力。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">整体来看，StableI2I 可以作为评价指标、benchmark 或 reward model，帮助提升图像编辑和图像恢复模型的保真度，使生成结果更加真实、一致和可靠。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.125" data-type="gif" data-w="960" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175855" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=ec608bc9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGWibJA4eXTZqc0B7wBrrdXG8lnabPSaEyRbTxeotBDT8y0zYm6G3yTwzv5zWeuKBkZNibWfTnecjMfRibmEXVicXKM1OEHgHVoYPKcU%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-ratio="0.7064814814814815" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175854" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=324e792b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8nsUCjjcZWbuuhe5a93xa7ct3SrVo3wmNeYye2thKB0q7YOZialB6cSHtUV0S8VcmRX2chdrGB6CEy6UoquoNdWFPj1gDQJWv8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=7050ed17&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659508%26idx%3D1%26sn%3Dad3f25fee643f8108d3c0e47edc48317">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Tue, 12 May 2026 18:33:00 +0800</pubDate>
    </item>
    <item>
      <title>港科大(广州)提出Align3D-AD：引入RGB引导，破解Zero-shot 3D异常检测“域差异”难题</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659449&amp;idx=1&amp;sn=ad1c5c5c53000ea79a0330161a579dd6</link>
      <description>引入RGB语义引导</description>
      <content:encoded><![CDATA[<p><span>CV君</span> <span>2026-05-11 23:39</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=3b584ee8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGW8UoCsmYCN7Tb4dibPl6iawParv9HnzcJQDmS6dRJ7hnQYn2r3sJulSDs4iaic3Jy7M0woOficAibzLkEYW00gEnwBp2D15qtBH6xqia4%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>引入RGB语义引导</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.2778649921507064" data-type="gif" data-w="637" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175789" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=47a3d9ee&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGWicicSu2v5JjHaLjpqsiaXHHMSt0bKSibfk6NJwmPSakUShVibQ4bAoMn80iadq8Qo8FymQehrnIziasAo4BU5oxTXJzrZ7XFd0lK2cI8%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在工业质检领域，3D异常检测一直是个“硬骨头”。虽然基于点云的检测能避开光照干扰，但异常样本极度稀缺，这让“零样本（Zero-shot）”检测成了刚需。最近，来自香港科技大学（广州）、香港科技大学以及湖南大学的研究团队提出了一种名为 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Align3D-AD</span></strong><span leaf=""> 的新框架，利用了训练阶段的 RGB 模态信息来增强 3D 检测性能。简单来说，它的核心思想是：既然 3D 渲染图太“抽象”，那就让它在训练时向相对“形象”的 RGB 图像看齐，从而借用视觉语言大模型强大的语义理解能力。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175788" data-ratio="0.4861111111111111" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=6a186013&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWib0y9DSokMibQcTYJN29c1icslS8YxlN27QMfwRKyVXlPa25hOicCLg1Taa3cEcMXcicUFzEbibXdMI1JaA7WUlQia8rplraLXUFpia1s%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2605.05850" target="_blank">https://arxiv.org/abs/2605.05850</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">代码仓库</span></b><span leaf="">: 暂无</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">弥补“域差异”：为什么3D检测需要RGB的帮助？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前的 Zero-shot 3D 异常检测主流做法是：把 3D 点云投影成多个视角的 2D 渲染图（Rendering Images），然后丢给预训练好的视觉语言模型（CLIP）去识别。但这里有个很尴尬的问题——CLIP 是在数亿张真实的 RGB 图片上训练出来的，它对色彩、纹理非常敏感；而 3D 点云生成的渲染图往往只有灰度或深度信息，看起来非常“素”，也就是论文中提到的</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">域差异（Domain Gap）</span></strong><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图1：Align3D-AD的动机。(a) 现有的Zero-shot 3D异常检测范式。(b) 提议方法与以往范式的比较。通过在训练期间加入RGB引导，模型产生与RGB对齐的表示，从而有效缓解视觉编码器固有的域差异。" class="rich_pages wxw-img" data-ratio="0.48055555555555557" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175787" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=af365e00&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8DPGicIngvm6NIdvVP8wKIfZVJ8D0XojcXicrrPCxkvZAXUaUU4FZPFHwxX4Guc2iaHp3ZzwW4KmMkcFbIw7x6H2N60EZEiardMia8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图1：Align3D-AD的动机。(a) 现有的Zero-shot 3D异常检测范式。(b) 提议方法与以往范式的比较。通过在训练期间加入RGB引导，模型产生与RGB对齐的表示，从而有效缓解视觉编码器固有的域差异。</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">如上图所示，以往的方法（a）直接把“素面朝天”的渲染图喂给 CLIP，效果自然打折扣。而 Align3D-AD（b）的想法是：在训练阶段，我们找一些带 RGB 信息的辅助数据（Auxiliary Data），让模型学习如何把渲染图的特征“翻译”成 RGB 空间的语义特征。这样，即使在推理时只有 3D 点云，模型也能“脑补”出丰富的视觉语义。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">方法详解：双阶段对齐与模态感知学习</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">Align3D-AD 的架构分为两个关键阶段：</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">跨模态特征对齐（Cross-Modal Feature Alignment）</span></strong><span leaf="">和</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">模态感知提示词学习（Modality-Aware Prompt Learning）</span></strong><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图2：Align3D-AD的总体框架。我们的模型由两个阶段组成：跨模态特征对齐和模态感知提示词学习。第一阶段在RGB特征空间中对齐渲染和RGB特征，并由语义一致性重加权策略进一步细化。第二阶段对RGB对齐分支和渲染分支进行模态感知提示词学习，并在后期激活双提示词对比对齐以增强提示词的判别力。推理时，综合两个分支的异常预测结果得到最终结果。" class="rich_pages wxw-img" data-ratio="0.9083333333333333" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175790" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=a1eb7d60&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9EMLBTjmMlEEkFK0M9OQ1YiamYUiaOqS7icXzjJ3C0E4bvXWSKibL0zFgFcibomyqvwmYIDsMbtgAnCa4E8FK86tLKHlSZXG5ic6rFg%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图2：Align3D-AD的总体框架。我们的模型由两个阶段组成：跨模态特征对齐和模态感知提示词学习。第一阶段在RGB特征空间中对齐渲染和RGB特征，并由语义一致性重加权策略进一步细化。第二阶段对RGB对齐分支和渲染分支进行模态感知提示词学习，并在后期激活双提示词对比对齐以增强提示词的判别力。推理时，综合两个分支的异常预测结果得到最终结果。</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">第一阶段：跨模态特征对齐</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了让渲染特征具备 RGB 的语义，作者设计了一个特征对齐器（Feature Aligner）。其 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Input</span></strong><span leaf=""> 是由视觉编码器（CLIP ViT-L/14@336px）提取的渲染图全局特征 </span><span style="cursor:pointer;" data-formula="G_i^{r}"><span data-formula="G_i^{r}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 1154.9 1005" aria-hidden="true" style="vertical-align: -0.679ex;width: 2.613ex;height: 2.274ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="mi"><path data-c="47" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q492 659 471 656T418 643T357 615T294 567T236 496T189 394T158 260Q156 242 156 221Q156 173 170 136T206 79T256 45T308 28T353 24Q407 24 452 47T514 106Q517 114 529 161T541 214Q541 222 528 224T468 227H431Q425 233 425 235T427 254Q431 267 437 273H454Q494 271 594 271Q634 271 659 271T695 272T707 272Q721 272 721 263Q721 261 719 249Q714 230 709 228Q706 227 694 227Q674 227 653 224Q646 221 643 215T629 164Q620 131 614 108Q589 6 586 3Q584 1 581 1Q571 1 553 21T530 52Q530 53 528 52T522 47Q448 -22 322 -22Q201 -22 126 55T50 252Z"></path></g><g data-mml-node="TeXAtom" transform="translate(786, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mi" transform="translate(786, -292.2) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 和局部特征 </span><span style="cursor:pointer;" data-formula="F_i^r"><span data-formula="F_i^r"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -680 1189.1 980" aria-hidden="true" style="vertical-align: -0.679ex;width: 2.69ex;height: 2.217ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="mi"><path data-c="46" d="M48 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H742Q749 676 749 669Q749 664 736 557T722 447Q720 440 702 440H690Q683 445 683 453Q683 454 686 477T689 530Q689 560 682 579T663 610T626 626T575 633T503 634H480Q398 633 393 631Q388 629 386 623Q385 622 352 492L320 363H375Q378 363 398 363T426 364T448 367T472 374T489 386Q502 398 511 419T524 457T529 475Q532 480 548 480H560Q567 475 567 470Q567 467 536 339T502 207Q500 200 482 200H470Q463 206 463 212Q463 215 468 234T473 274Q473 303 453 310T364 317H309L277 190Q245 66 245 60Q245 46 334 46H359Q365 40 365 39T363 19Q359 6 353 0H336Q295 2 185 2Q120 2 86 2T48 1Z"></path></g><g data-mml-node="mi" transform="translate(820.2, 363) scale(0.707)"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(643, -292.2) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">，</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Output</span></strong><span leaf=""> 则是投影到 RGB 空间后的对齐特征 </span><span style="cursor:pointer;" data-formula="G_i^{r_a}"><span data-formula="G_i^{r_a}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -777.2 1454.8 1078.8" aria-hidden="true" style="vertical-align: -0.682ex;width: 3.291ex;height: 2.441ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="mi"><path data-c="47" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q492 659 471 656T418 643T357 615T294 567T236 496T189 394T158 260Q156 242 156 221Q156 173 170 136T206 79T256 45T308 28T353 24Q407 24 452 47T514 106Q517 114 529 161T541 214Q541 222 528 224T468 227H431Q425 233 425 235T427 254Q431 267 437 273H454Q494 271 594 271Q634 271 659 271T695 272T707 272Q721 272 721 263Q721 261 719 249Q714 230 709 228Q706 227 694 227Q674 227 653 224Q646 221 643 215T629 164Q620 131 614 108Q589 6 586 3Q584 1 581 1Q571 1 553 21T530 52Q530 53 528 52T522 47Q448 -22 322 -22Q201 -22 126 55T50 252Z"></path></g><g data-mml-node="TeXAtom" transform="translate(786, 464.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(451, -150) scale(0.707)"><path data-c="61" d="M33 157Q33 258 109 349T280 441Q331 441 370 392Q386 422 416 422Q429 422 439 414T449 394Q449 381 412 234T374 68Q374 43 381 35T402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487Q506 153 506 144Q506 138 501 117T481 63T449 13Q436 0 417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157ZM351 328Q351 334 346 350T323 385T277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q217 26 254 59T298 110Q300 114 325 217T351 328Z"></path></g></g></g><g data-mml-node="mi" transform="translate(786, -293.8) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 和 </span><span style="cursor:pointer;" data-formula="F_i^{r_a}"><span data-formula="F_i^{r_a}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -777.2 1489 1078.8" aria-hidden="true" style="vertical-align: -0.682ex;width: 3.369ex;height: 2.441ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="mi"><path data-c="46" d="M48 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H742Q749 676 749 669Q749 664 736 557T722 447Q720 440 702 440H690Q683 445 683 453Q683 454 686 477T689 530Q689 560 682 579T663 610T626 626T575 633T503 634H480Q398 633 393 631Q388 629 386 623Q385 622 352 492L320 363H375Q378 363 398 363T426 364T448 367T472 374T489 386Q502 398 511 419T524 457T529 475Q532 480 548 480H560Q567 475 567 470Q567 467 536 339T502 207Q500 200 482 200H470Q463 206 463 212Q463 215 468 234T473 274Q473 303 453 310T364 317H309L277 190Q245 66 245 60Q245 46 334 46H359Q365 40 365 39T363 19Q359 6 353 0H336Q295 2 185 2Q120 2 86 2T48 1Z"></path></g><g data-mml-node="TeXAtom" transform="translate(820.2, 464.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(451, -150) scale(0.707)"><path data-c="61" d="M33 157Q33 258 109 349T280 441Q331 441 370 392Q386 422 416 422Q429 422 439 414T449 394Q449 381 412 234T374 68Q374 43 381 35T402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487Q506 153 506 144Q506 138 501 117T481 63T449 13Q436 0 417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157ZM351 328Q351 334 346 350T323 385T277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q217 26 254 59T298 110Q300 114 325 217T351 328Z"></path></g></g></g><g data-mml-node="mi" transform="translate(643, -293.8) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这里有一个值得一提的设计：</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">语义一致性重加权（Semantic Consistency Reweighting, SCR）</span></strong><span leaf="">。作者认为，并不是渲染图上的所有区域都同等重要。他们计算了渲染特征和 RGB 特征之间的语义一致性矩阵 </span><span style="cursor:pointer;" data-formula="C_i = F_i^{r} (F_i^{R})^{\top}"><span data-formula="C_i = F_i^{r} (F_i^{R})^{\top}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -851.4 6316.6 1153" aria-hidden="true" style="vertical-align: -0.682ex;width: 14.291ex;height: 2.609ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="mi" transform="translate(715, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(1286.7, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msubsup" transform="translate(2342.5, 0)"><g data-mml-node="mi"><path data-c="46" d="M48 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H742Q749 676 749 669Q749 664 736 557T722 447Q720 440 702 440H690Q683 445 683 453Q683 454 686 477T689 530Q689 560 682 579T663 610T626 626T575 633T503 634H480Q398 633 393 631Q388 629 386 623Q385 622 352 492L320 363H375Q378 363 398 363T426 364T448 367T472 374T489 386Q502 398 511 419T524 457T529 475Q532 480 548 480H560Q567 475 567 470Q567 467 536 339T502 207Q500 200 482 200H470Q463 206 463 212Q463 215 468 234T473 274Q473 303 453 310T364 317H309L277 190Q245 66 245 60Q245 46 334 46H359Q365 40 365 39T363 19Q359 6 353 0H336Q295 2 185 2Q120 2 86 2T48 1Z"></path></g><g data-mml-node="TeXAtom" transform="translate(820.2, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mi" transform="translate(643, -292.2) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(3531.6, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msubsup" transform="translate(3920.6, 0)"><g data-mml-node="mi"><path data-c="46" d="M48 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H742Q749 676 749 669Q749 664 736 557T722 447Q720 440 702 440H690Q683 445 683 453Q683 454 686 477T689 530Q689 560 682 579T663 610T626 626T575 633T503 634H480Q398 633 393 631Q388 629 386 623Q385 622 352 492L320 363H375Q378 363 398 363T426 364T448 367T472 374T489 386Q502 398 511 419T524 457T529 475Q532 480 548 480H560Q567 475 567 470Q567 467 536 339T502 207Q500 200 482 200H470Q463 206 463 212Q463 215 468 234T473 274Q473 303 453 310T364 317H309L277 190Q245 66 245 60Q245 46 334 46H359Q365 40 365 39T363 19Q359 6 353 0H336Q295 2 185 2Q120 2 86 2T48 1Z"></path></g><g data-mml-node="TeXAtom" transform="translate(820.2, 368.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="52" d="M230 637Q203 637 198 638T193 649Q193 676 204 682Q206 683 378 683Q550 682 564 680Q620 672 658 652T712 606T733 563T739 529Q739 484 710 445T643 385T576 351T538 338L545 333Q612 295 612 223Q612 212 607 162T602 80V71Q602 53 603 43T614 25T640 16Q668 16 686 38T712 85Q717 99 720 102T735 105Q755 105 755 93Q755 75 731 36Q693 -21 641 -21H632Q571 -21 531 4T487 82Q487 109 502 166T517 239Q517 290 474 313Q459 320 449 321T378 323H309L277 193Q244 61 244 59Q244 55 245 54T252 50T269 48T302 46H333Q339 38 339 37T336 19Q332 6 326 0H311Q275 2 180 2Q146 2 117 2T71 2T50 1Q33 1 33 10Q33 12 36 24Q41 43 46 45Q50 46 61 46H67Q94 46 127 49Q141 52 146 61Q149 65 218 339T287 628Q287 635 230 637ZM630 554Q630 586 609 608T523 636Q521 636 500 636T462 637H440Q393 637 386 627Q385 624 352 494T319 361Q319 360 388 360Q466 361 492 367Q556 377 592 426Q608 449 619 486T630 554Z"></path></g></g><g data-mml-node="mi" transform="translate(643, -293.8) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="msup" transform="translate(5327.5, 0)"><g data-mml-node="mo"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="TeXAtom" transform="translate(389, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="22A4" d="M55 642T55 648T59 659T66 666T71 668H708Q723 660 723 648T708 628H409V15Q402 2 391 0Q387 0 384 1T379 3T375 6T373 9T371 13T369 16V628H71Q70 628 67 630T59 637Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">，并据此生成局部权重：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="w_{i,n} = 1 + \lambda \cdot \sigma(c_{i,n})
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 8689 1037.2" aria-hidden="true" style="max-width: 300%;vertical-align: -0.65ex;width: 19.658ex;height: 2.347ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(716, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g></g></g><g data-mml-node="mo" transform="translate(1908.6, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(2964.3, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(3686.6, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mi" transform="translate(4686.8, 0)"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mo" transform="translate(5492, 0)"><path data-c="22C5" d="M78 250Q78 274 95 292T138 310Q162 310 180 294T199 251Q199 226 182 208T139 190T96 207T78 250Z"></path></g><g data-mml-node="mi" transform="translate(5992.2, 0)"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g><g data-mml-node="mo" transform="translate(6563.2, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(6952.2, 0)"><g data-mml-node="mi"><path data-c="63" d="M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z"></path></g><g data-mml-node="TeXAtom" transform="translate(433, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g></g></g><g data-mml-node="mo" transform="translate(8300, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中 </span><span style="cursor:pointer;" data-formula="\sigma"><span data-formula="\sigma"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -431 571 442" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.292ex;height: 1ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 是 Sigmoid 函数。这个策略能让模型自动关注那些跨模态差异较大的区域（通常是几何结构复杂的区域），从而实现更稳健的对齐。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">第二阶段：模态感知提示词学习</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">对齐之后，模型拥有了两路特征：原始的渲染特征和对齐后的“伪 RGB”特征。为了充分利用这两者，作者提出了</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">双提示词对比对齐（Dual-prompt Contrastive Alignment, DpCA）</span></strong><span leaf="">。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">独立建模</span></b><span leaf="">：为两路特征分别设置独立的“正常”和“异常”提示词（Prompts），捕捉各自模态特有的语义。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">多准则监督</span></b><span leaf="">：作者不仅使用了图像级的分类损失，还引入了针对 3D 点云和 2D 像素的分割损失。具体来说，结合了 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Dice Loss</span></strong><span leaf=""> 以处理类别不平衡，并辅以 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Focal Loss</span></strong><span leaf=""> 来强化对困难样本的关注。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">对比增强</span></b><span leaf="">：在训练后期，通过对比损失 </span><span style="cursor:pointer;" data-formula="\mathcal{L}_{con}^{m}"><span data-formula="\mathcal{L}_{con}^{m}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -744.6 1813.4 999.4" aria-hidden="true" style="vertical-align: -0.576ex;width: 4.103ex;height: 2.261ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, 432.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="6D" d="M21 287Q22 293 24 303T36 341T56 388T88 425T132 442T175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q303 442 384 442Q401 442 415 440T441 433T460 423T475 411T485 398T493 385T497 373T500 364T502 357L510 367Q573 442 659 442Q713 442 746 415T780 336Q780 285 742 178T704 50Q705 36 709 31T724 26Q752 26 776 56T815 138Q818 149 821 151T837 153Q857 153 857 145Q857 144 853 130Q845 101 831 73T785 17T716 -10Q669 -10 648 17T627 73Q627 92 663 193T700 345Q700 404 656 404H651Q565 404 506 303L499 291L466 157Q433 26 428 16Q415 -11 385 -11Q372 -11 364 -4T353 8T350 18Q350 29 384 161L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 181Q151 335 151 342Q154 357 154 369Q154 405 129 405Q107 405 92 377T69 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -247) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="63" d="M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z"></path></g><g data-mml-node="mi" transform="translate(433, 0)"><path data-c="6F" d="M201 -11Q126 -11 80 38T34 156Q34 221 64 279T146 380Q222 441 301 441Q333 441 341 440Q354 437 367 433T402 417T438 387T464 338T476 268Q476 161 390 75T201 -11ZM121 120Q121 70 147 48T206 26Q250 26 289 58T351 142Q360 163 374 216T388 308Q388 352 370 375Q346 405 306 405Q243 405 195 347Q158 303 140 230T121 120Z"></path></g><g data-mml-node="mi" transform="translate(918, 0)"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 强制让两路提示词在语义空间保持一致且相互区分，进一步提升判别能力。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在推理时，模型只需要输入 3D 点云生成的渲染图，通过学习好的对齐器和提示词，就能同时从几何和语义两个维度给出异常评分。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果：刷新多项SOTA</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队在 MVTec3D-AD、Eyecandies 和 Real3D-AD 三大主流数据集上进行了严苛的测试。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 性能表现</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在 MVTec3D-AD 数据集上，Align3D-AD 表现惊人，达到了 </span><font color="#0000FF"><b><span leaf="">83.0% O-R</span></b></font><span leaf="">（对象级 AUROC）和 </span><font color="#0000FF"><b><span leaf="">94.3% O-A</span></b></font><span leaf="">（对象级 AP），全面超越了之前的标杆模型 PointAD 和 GS-CLIP。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="表1：MVTec3D-AD和Eyecandies上的One-vs-rest结果。" class="rich_pages wxw-img" data-ratio="0.4502923976608187" data-type="png" data-w="684" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175791" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=e8abd3a4&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9BBUWq4UGDn8zRicqQntzWjVDwtcTyzdxPtgEyUgqk7ILuiaO0DFrNTKtttAIlygAhHh0Rib9MzEuqf8UMibgIW0uibjGtMggJsjics%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">表1：MVTec3D-AD和Eyecandies上的One-vs-rest结果。</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在跨数据集测试中（例如在 MVTec3D 上训练，直接去测 Real3D-AD），Align3D-AD 依然保持了极强的泛化能力。即使 Real3D-AD 这种完全没有 RGB 信息的数据集，模型依然能凭借学到的对齐能力取得 </span><font color="#0000FF"><b><span leaf="">76.1% O-R</span></b></font><span leaf=""> 的好成绩。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.4342105263157895" data-type="png" data-w="684" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175793" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=ef768b4a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibls54hrMXJkh8T3mWU41oKbZIhzu7dflYHnyaibfl9cGFfHrh8H8GibhgUfEwchUrThTDrOpFSINPTASD2okV8bIPXBU47oGTf8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 可视化效果</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从定性分析来看，Align3D-AD 生成的异常热力图（Anomaly Map）非常精准，能够清晰地定位出如 Bagel 的裂纹、Cookie 的破损等细微异常。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图3：MVTec3D-AD和Eyecandies上的定性可视化结果。" class="rich_pages wxw-img" data-ratio="0.33796296296296297" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175794" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=06c3910b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWib7Huu2YclhugcsXbmZaLibSricInclP7uRytyeEmqbhib1JTqqzFawMe23jpWrcN9v5D2tHS2ficiagxywPaFNOWe3PgOIAtv7SeRI%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图3：MVTec3D-AD和Eyecandies上的定性可视化结果。</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">可以看到，单纯的渲染分支（Rendering）有时会漏检一些语义层面的细微缺陷，而“RGB 对齐”分支（RGB-aligned）则能敏锐地捕捉到这些信息。两者结合后，最终的集成预测（Integrated）在边界刻画和检测准确度上都达到了极高水平。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 效率与开销</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">NVIDIA RTX 4090</span></strong><span leaf=""> 上，其推理速度约为 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">5.30 FPS</span></strong><span leaf="">，单张图片的推理时间仅需 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">0.19s</span></strong><span leaf="">，显存占用仅为 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">2791 MB</span></strong><span leaf="">。相比于融合了点云、深度图等多种模态的 GS-CLIP，Align3D-AD 的效率提升了近 3 倍。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="表7：MVTec3D-AD上的推理时间、FPS和GPU显存占用比较。" class="rich_pages wxw-img" data-ratio="0.4827586206896552" data-type="png" data-w="609" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175792" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=1d3166be&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8U44VjAk795rhlnOlLf61CGtUkY9tJ3YDXh6dj5KvYN8gaWwVFDoxdGHnpiajWf2Obb7O39tCFrDuPmLnFPfCdJXVWjcaACtUI%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">表7：MVTec3D-AD上的推理时间、FPS和GPU显存占用比较。</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">Align3D-AD 的成功给我们带来了一个很有启发性的思考：在处理 3D 任务时，我们未必只能死磕 3D 数据。通过跨模态对齐，我们完全可以“借用” 2D 领域那庞大且深厚的语义知识库。这种“训练时引导、推理时解耦”的思路，既保证了推理阶段的简洁性，又极大地提升了模型的语义感知能力。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">希望项目早日开源。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.125" data-type="gif" data-w="960" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175795" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=3f088030&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW9jQlGu5LrooHyhQDuHgibEOywnqVauzIuwubDsfFcqoSsEP1RpoAX5tiaoic4SodGialY80U9hLvN4RObnzr7p4mkOfpW6hJYnjk4%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-ratio="0.7064814814814815" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175796" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=060b3109&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8eC4LHUfCs0EGpz1TY2mXTuENv0c9BovzHzWicm6o3iaPIt832aFXdxCr017U6ic6sCUuMD7YJ9Y2n4s6T0ibwaAH2UgIHicgM8k94%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=fd7b67de&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659449%26idx%3D1%26sn%3Dad1c5c5c53000ea79a0330161a579dd6">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 11 May 2026 23:39:00 +0800</pubDate>
    </item>
    <item>
      <title>TPAMI 2026 高分辨率高光谱视频成像新路径：马赛克与全色融合的等变贝叶斯推理框架</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659419&amp;idx=1&amp;sn=87a3983698c4b5b339ff737ead513031</link>
      <description></description>
      <content:encoded><![CDATA[<p>原创 <span>52CV</span> <span>2026-05-10 07:05</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=6a32539b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGW9XMMleiaKmFoULHswpiccVgYP7Sbbo44pNoO540cydDaPXLhia7XOl83Ookd4JlST0l7iblNFSib91dMP8viahoq7KzjBCUkT3wwfDM%2F0%3Fwx_fmt%3Djpeg"/></p>
  
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175743" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2778649921507064" data-w="637" src="https://wechat2rss.xlab.app/img-proxy/?k=eff46691&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGW9QnkRUmTSLyBzdicgOa8hH0icWv0q86AKDbXK1t71fZuPoR5caicC2bUzfU5gT1iaA5qlsvCoSqJp6VTaQb3no3ejQGL6u0bKZTHk%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">导语</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">高光谱成像能够同时获取场景的</span><font color="#0000FF"><b><span leaf="">空间结构信息</span></b></font><span leaf="">与</span><font color="#0000FF"><b><span leaf="">细粒度光谱信息</span></b></font><span leaf="">，因此在遥感监测、精准农业、医学诊断、环境观测和工业检测等领域具有重要价值。传统高光谱成像通常依赖点扫描、线扫描或波段扫描来逐步获取三维光谱数据立方体，虽然光谱精度较高，但采集速度慢、系统复杂，在动态场景中容易受到运动、光照变化和时间不同步等因素影响。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">快照式高光谱成像为这一问题提供了新的路径：它希望在</span><font color="#0000FF"><b><span leaf="">单次曝光</span></b></font><span leaf="">或极短时间内完成高光谱信息获取。其中，基于光谱滤波阵列的 Mosaic/SFA 成像方式具有结构紧凑、易于集成、适合视频速率采集等优势。但 Mosaic 图像本质上是稀疏光谱采样：每个像素位置只记录一个或少数几个波段，导致恢复后的高光谱图像容易出现空间细节不足、纹理模糊和光谱失真。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了进一步提升空间分辨率，一种有效方案是将低分辨率多波段 Mosaic 图像与高分辨率单波段 PAN 图像进行融合。PAN 图像能够提供更清晰的空间结构，Mosaic 图像则保留多波段光谱信息，两者互补后有望得到高空间分辨率的高光谱图像。然而，现有方法仍面临两个关键难点：其一，真实场景中很难获得严格配准的高分辨率高光谱真值；其二，Mosaic 与 PAN 的真实成像退化过程存在噪声、点扩散、光谱响应不确定等复杂因素，如果仅用理想化退化模型，容易造成空间或光谱失真。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">针对上述问题，科研团队提出论文 </span><b><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">《Equivariant Bayesian Hyperspectral Imaging via Mosaiced and PAN Image Fusion》</span></code></b><span leaf="">，构建了一套面向 Mosaic/PAN 双输入高光谱融合的</span><font color="#0000FF"><b><span leaf="">等变贝叶斯变分推断框架</span></b></font><span leaf="">。该方法将目标 HR-HSI 分解为</span><font color="#0000FF"><b><span leaf="">主成分（principal component）</span></b></font><span leaf="">和</span><font color="#0000FF"><b><span leaf="">稀疏残差（sparsity residual）</span></b></font><span leaf="">，并在贝叶斯变分推断中显式建模噪声、可学习退化函数与等变先验，从而实现更加物理可解释、鲁棒且高质量的高分辨率高光谱重建。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175744" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.1982840800762631" data-w="1049" src="https://wechat2rss.xlab.app/img-proxy/?k=0589853d&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW85dibTTsmFDWqlQ0VeQ76TuReyaMpSubdIsIjN44g5C9avxdYRUia9elBDCOA5501JXiciazmWEz7cCsJx4PfUaYicDwqDB3xtd9Z8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">论文题目：</span></strong><span leaf=""> Equivariant Bayesian Hyperspectral Imaging via Mosaiced and PAN Image Fusion</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">中文题目：</span></strong><span leaf=""> 基于马赛克与全色图像融合的等变贝叶斯高光谱成像方法</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">发表期刊：</span></strong><span leaf=""> IEEE Transactions on Pattern Analysis and Machine Intelligence（TPAMI）</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">发表年份：</span></strong><span leaf=""> 2026</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">论文链接：</span></strong><span leaf=""> <a href="https://ieeexplore.ieee.org/document/11480451" target="_blank">https://ieeexplore.ieee.org/document/11480451</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">DOI：</span></strong><span leaf=""> 10.1109/TPAMI.2026.3682543</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">代码链接：</span></strong><span leaf=""> <a href="https://github.com/Nan-Wong98/Equivariant-Bayesian-variational-inference-framework" target="_blank">https://github.com/Nan-Wong98/Equivariant-Bayesian-variational-inference-framework</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">论文作者：</span></strong><span leaf=""> Renwei Dian, Nan Wang†（通讯作者）, Anjing Guo, Shutao Li</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">作者单位：</span></strong><span leaf=""> 湖南大学</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">⭐ 论文摘要</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">高分辨率高光谱视频成像可以通过在单次曝光或短时间内融合多波段低分辨率 Mosaic 图像与单波段高分辨率 PAN 图像来实现。然而，现有 Mosaic/PAN 融合方法常常难以同时兼顾空间细节与光谱保真，容易产生空间模糊、纹理伪影或光谱偏移。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为缓解这一问题，论文提出了一种</span><font color="#0000FF"><b><span leaf="">等变贝叶斯变分推断框架</span></b></font><span leaf="">。其核心思想不是直接让网络从 Mosaic/PAN 输入一步预测 HR-HSI，而是将 HR-HSI 表示为两部分之和：一部分是描述主要结构与低频光谱趋势的</span><font color="#0000FF"><b><span leaf="">主成分</span></b></font><span leaf="">，另一部分是刻画高频细节和局部差异的</span><font color="#0000FF"><b><span leaf="">稀疏残差</span></b></font><span leaf="">。两部分均通过共享深度网络在变分推断框架下估计，使重建过程兼具准确性与物理解释性。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">与此同时，论文将</span><font color="#0000FF"><b><span leaf="">等变成像先验（Equivariant Imaging Prior, EI Prior）</span></b></font><span leaf="">引入贝叶斯框架，使网络能够在无 HR-HSI 真值的条件下利用几何变换一致性拓展学习空间。进一步地，作者从物理成像模型出发构建</span><font color="#0000FF"><b><span leaf="">可学习退化函数</span></b></font><span leaf="">，并对 PSF 相关参数和 SRF 相关参数施加物理合理约束，使退化函数在训练中自适应估计，从而更好解释真实 Mosaic/PAN 观测。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">大量模拟数据和真实数据实验表明，该方法在空间重建质量、光谱一致性和真实场景鲁棒性方面均取得了优于多种对比方法的表现，为高光谱计算成像系统提供了一种更加稳健和灵活的解决方案。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">🚀 引言</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">高光谱图像（HSI）可以记录每个空间位置在多个连续波段上的反射或辐射信息，因此相较普通 RGB 图像，它不仅能“看见形状”，还能进一步区分材料、成分和物理属性。在精准农业中，不同作物长势和病虫害状态可能对应不同光谱响应；在遥感监测中，不同地物类型的光谱曲线可以辅助精细分类；在工业检测和医学诊断中，高光谱数据也常被用于缺陷识别、组织分析和定量检测。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">不过，高光谱成像长期受到采集方式限制。扫描式系统需要通过空间或光谱维度逐步采样，虽然可以获得较完整的光谱立方体，但时间分辨率较低，很难适用于快速运动目标或实时场景。快照式高光谱成像希望在一次曝光中完成高维信息压缩采集，再通过计算方法恢复完整高光谱数据。其中，Mosaic/SFA 方案将窄带光谱滤波器阵列集成在传感器前端，类似 RGB 相机中的 Bayer 阵列，因此具有结构简单和视频速率采集潜力。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">问题在于，Mosaic 传感器将不同波段分散在不同像素位置上，本质上牺牲了每个波段的空间采样密度。为了得到更高空间分辨率，论文考虑一种双输入成像模式：系统同时采集一幅低分辨率 Mosaic 图像和一幅高分辨率 PAN 图像，然后通过计算融合恢复 HR-HSI。Mosaic 图像负责提供多波段光谱线索，PAN 图像负责提供高分辨率空间纹理，这一路线能够在保持快照采集优势的同时改善空间细节。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">然而，将该问题简单拆成“先光谱去马赛克、再全色锐化”并不充分。两阶段处理容易造成误差累积：第一阶段的光谱恢复误差会传递到第二阶段，第二阶段的空间增强又可能破坏光谱一致性。更重要的是，真实系统中的退化过程并不完全已知，Mosaic 图像受到 PSF、SFA 采样、下采样和噪声影响，PAN 图像也受到相对 SRF 和噪声影响。如果算法没有显式处理这些不确定性，就很难在真实场景中稳定工作。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">因此，本文的关键问题可以概括为：</span><b><font color="#0000FF"><span leaf="">在没有高分辨率高光谱真值、退化函数又不完全可知的情况下，如何利用 Mosaic 与 PAN 的互补观测，恢复出空间清晰且光谱可信的 HR-HSI？</span></font></b></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">🌟 研究背景</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">高光谱成像的目标，是在同一观测过程中同时获得场景的空间结构与连续光谱响应。空间信息帮助我们判断目标形状、纹理和边界，光谱信息则进一步揭示材料、成分和状态差异，因此高光谱成像在遥感观测、农业生产、资源调查、医疗检测、工业制造和军事侦察等场景中都有重要价值。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">但从成像体制来看，高光谱成像长期受到时空谱分辨率相互制约的限制。传统扫描式成像可以获得较高的光谱分辨率，但通常需要逐点、逐行或逐波段完成采集，成像速度慢，难以直接面向动态场景和视频级观测。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图1 扫描式成像技术优缺点" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175747" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5055387713997986" data-w="993" src="https://wechat2rss.xlab.app/img-proxy/?k=36588ff1&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibTuciamNxla1rX4l5Av4gZbezmRgibXO4KWyVc6YTjGe0d1VjlbS2rwm3vuf1GJBwzwDs5LzkMibzAqWNzAiaM9FuRnb3iaMaG4ghw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图1 扫描式成像技术优缺点</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为提升瞬时成像能力，编码孔径快照光谱成像等计算成像方案将三维光谱数据压缩编码到二维观测中，再通过优化或深度重建算法恢复高光谱图像。这类方法提高了时间分辨率，但编码混叠也会增强反演的病态性，容易带来信噪比下降、空间细节损失和光谱失真等问题。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图2 编码孔径快照成像技术优缺点" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175745" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5217391304347826" data-w="966" src="https://wechat2rss.xlab.app/img-proxy/?k=dd9254a3&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8XccY2ibGeNLBewKYbVGLeQJ6J0Rmh6hVvVhqmhzm0AEOwRJEAaE6hiaJtm3Cw127FsibsKWZBoeEiaM0gErkzcDWWSUH8TfKNhEQ%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图2 编码孔径快照成像技术优缺点</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">相比之下，基于滤波阵列的快照式马赛克高光谱成像结构更紧凑，单次曝光即可获得整帧多光谱/高光谱观测，具有视频采集潜力。不过，马赛克成像需要在有限像元上同时分配空间采样和光谱采样，波段数增加通常会降低单波段空间采样密度，因此容易出现空间分辨率不足的问题。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图3 快照式马赛克成像技术优缺点" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175746" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.4862665310274669" data-w="983" src="https://wechat2rss.xlab.app/img-proxy/?k=38f8e909&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8u2xULyG9xLfvPOCSZ4xSiaZlA1Kb9IAjibrbw5XOGs5rHaKeEySORBctibQ04qGXq4n11Aiavibce0X4Mj7z9yTAb33Hs3BW8AB0E%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图3 快照式马赛克成像技术优缺点</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">本文采用的 Mosaic/PAN 融合思想正是针对这一矛盾展开：Mosaic 图像提供多波段光谱信息，PAN 图像提供高分辨率空间结构，两者在信息层面形成互补。通过共孔径、双光路协同获取马赛克视频帧和全色视频帧，再利用融合算法恢复高分辨率高光谱视频帧，可以在保持快照采集能力的同时补全空间细节，为动态场景高分辨率高光谱观测提供可行路径。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图4 马赛克与全色融合优势互补" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175749" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.4727463312368973" data-w="954" src="https://wechat2rss.xlab.app/img-proxy/?k=739a7d7f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9DbeXjKG6hbWe0iaFibN7y2qnMhLqhEd8G5f4yCCQO0nNRrTYC25rdohENngRibf33ibUtI9ajXcM1fLBtJ16kMEx7d3z2YankZDU%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图4 马赛克与全色融合优势互补</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从论文任务来看，这一融合路线并不只是简单把两幅图像拼接输入网络。Mosaic 分支受到 PSF、光谱滤波阵列、下采样和噪声影响，PAN 分支则受到 SRF 和噪声影响；如果退化模型不准确，融合结果就容易产生空间或光谱畸变。因此，本文进一步从成像物理模型出发，将可学习退化函数、贝叶斯不确定性建模与等变成像先验结合起来，解决真实场景中无真值、退化未知和重建不稳定的问题。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图5 Mosaic/PAN 物理成像模型示意图，展示两路观测与 HR-HSI 重建之间的退化关系" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175750" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5305514157973175" data-w="671" src="https://wechat2rss.xlab.app/img-proxy/?k=94993665&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9HBhAhbP7icBWf5qG64DJVntR22zGVMNvz5x5jvE5II6jtibzekdjVn4b5JCGHSOPicXoy3xYUNUGwk0V0tYia8tCLCd5FzhEj9icQ%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图5 Mosaic/PAN 物理成像模型示意图，展示两路观测与 HR-HSI 重建之间的退化关系</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">🔎 核心创新</span></span></h2><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 将 HR-HSI 分解为“主成分 + 稀疏残差”</span></span></h3><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图6 等变贝叶斯变分推断框架" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175748" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5537037037037037" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=4e45d63b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8X5vzIugL2xm9Lpa4bcSIUTme1Jx6a209BK5V4tKtFOEtv88N45Nry7MOaOclZfkxBf7DAmfcAVEar5LM7Zycf23oKQEPQogY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图6 等变贝叶斯变分推断框架</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">本文最重要的思想之一，是不再把 HR-HSI 看作一个需要直接整体预测的黑箱变量，而是将其分解为：</span></p><p><i><span leaf="">x</span></i><span leaf=""> = </span><i><span leaf="">f</span></i><span leaf=""> + </span><i><span leaf="">g</span></i></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中，</span><i><span leaf="">x</span></i><span leaf=""> 表示目标高分辨率高光谱图像，</span><i><span leaf="">f</span></i><span leaf=""> 表示主成分，</span><i><span leaf="">g</span></i><span leaf=""> 表示稀疏残差。主成分用于表达图像中的主要结构、低频光谱趋势和稳定背景信息；稀疏残差则用于补充局部高频细节、纹理变化和主成分难以覆盖的细节成分。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种分解方式的价值在于，它让网络不必在同一个表示中同时承担所有任务。高光谱图像中既有强相关的光谱结构，也有局部突变的边缘和纹理，如果直接整体建模，很容易在空间锐化和光谱保持之间产生冲突。通过主成分与稀疏残差分解，模型可以将“稳定主体”和“细节修正”分开处理，使重建过程更符合图像形成和图像恢复中的结构先验。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">更进一步，论文并没有使用两个完全独立的网络分别估计 </span><i><span leaf="">f</span></i><span leaf=""> 和 </span><i><span leaf="">g</span></i><span leaf="">，而是采用</span><b><font color="#0000FF"><span leaf="">共享 DNN</span></font></b><span leaf="">进行估计。共享网络相当于在两个变量之间引入了一种隐式正则化，使主成分和稀疏残差虽然功能不同，但仍处在统一的观测到目标空间映射中。消融实验表明，相比不做分解或使用两个独立 DNN，主成分/残差分解加共享网络的设计在 CAVE 和真实数据上都能带来更稳定的融合效果。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 以贝叶斯变分推断显式刻画不确定性</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">Mosaic/PAN 融合是一个典型的病态逆问题：从低维观测恢复高维 HR-HSI，本身存在多个可能解。如果只训练一个确定性网络，模型往往只能学习一个点估计，难以显式处理噪声和观测不确定性。本文将问题放入贝叶斯变分推断框架中，目标是估计潜变量的后验分布，而不仅仅是预测单一图像。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">论文中需要估计的潜变量包括 PAN 噪声 </span><i><span leaf="">n</span></i><sub style="line-height: 0;"><span leaf="">y</span></sub><span leaf="">、Mosaic 噪声 </span><i><span leaf="">n</span></i><sub style="line-height: 0;"><span leaf="">z</span></sub><span leaf="">、主成分 </span><i><span leaf="">f</span></i><span leaf=""> 和稀疏残差 </span><i><span leaf="">g</span></i><span leaf="">。作者将这些变量建模为高斯分布，并由网络输出均值和方差，再通过重参数化技巧进行采样。这样，模型在训练过程中不仅学习“图像应该是什么样”，也学习“观测噪声和重建不确定性应该如何解释”。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这一设计对于真实成像尤其重要。真实 Mosaic/PAN 数据往往受到热噪声、运动模糊、照明变化和传感器限制影响，与理想模拟退化存在明显差异。显式噪声建模使网络能够把部分观测误差归因到噪声项，而不是强行将所有变化都解释为图像结构，从而减少错误纹理、色偏和光谱失真。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 从物理模型出发构建可学习退化函数</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">等变成像方法通常假设退化函数是可访问的，也就是说，模型知道如何将目标图像重新退化到观测空间。但在 Mosaic/PAN 融合任务中，这一假设并不完全成立。Mosaic 分支涉及 PSF、SFA mosaicing 和 2×2 平均下采样，PAN 分支涉及光谱响应函数 SRF，而且真实系统中的 PSF 与 SRF 很难精确标定。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">因此，本文没有把退化函数简单设为固定算子，而是设计了两个基于物理模型的可学习退化函数：</span></p><p><i><span leaf="">y</span></i><span leaf=""> = </span><i><span leaf="">A</span></i><sub style="line-height: 0;"><span leaf="">y</span></sub><span leaf="">(</span><i><span leaf="">f</span></i><span leaf=""> + </span><i><span leaf="">g</span></i><span leaf="">) + </span><i><span leaf="">n</span></i><sub style="line-height: 0;"><span leaf="">y</span></sub></p><p><i><span leaf="">z</span></i><span leaf=""> = </span><i><span leaf="">A</span></i><sub style="line-height: 0;"><span leaf="">z</span></sub><span leaf="">(</span><i><span leaf="">f</span></i><span leaf=""> + </span><i><span leaf="">g</span></i><span leaf="">) + </span><i><span leaf="">n</span></i><sub style="line-height: 0;"><span leaf="">z</span></sub></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中，</span><i><span leaf="">y</span></i><span leaf=""> 为 PAN 图像，</span><i><span leaf="">z</span></i><span leaf=""> 为 Mosaic 图像。</span><i><span leaf="">A</span></i><sub style="line-height: 0;"><span leaf="">y</span></sub><span leaf=""> 对应 PAN 退化过程，主要由相对 SRF 参数 </span><i><span leaf="">r</span></i><span leaf=""> 实现；</span><i><span leaf="">A</span></i><sub style="line-height: 0;"><span leaf="">z</span></sub><span leaf=""> 对应 Mosaic 退化过程，包含 PSF 相关卷积核 </span><i><span leaf="">k</span></i><span leaf="">、mosaicing matrix </span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">M</span></code><span leaf=""> 和下采样操作。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在具体实现中，</span><i><span leaf="">r</span></i><span leaf=""> 由无偏置 1×1 卷积实现，</span><i><span leaf="">k</span></i><span leaf=""> 由无偏置通道级 5×5 卷积实现。更重要的是，作者对这些参数施加物理约束：PSF 相关参数 </span><i><span leaf="">k</span></i><span leaf=""> 满足非负约束，SRF 相关参数 </span><i><span leaf="">r</span></i><span leaf=""> 同时满足非负与和为 1 的约束。这避免了退化函数在训练中偏离物理合理范围，也让学习到的 PSF/SRF 更适合解释真实观测。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">4. 将等变成像先验融入贝叶斯框架</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">等变成像先验的基本思想是：自然图像在翻转、旋转、平移等几何变换下应保持一定结构一致性。如果一个网络能够重建出合理图像，那么对重建结果施加几何变换后，再退化回观测空间并重新重建，结果也应与变换后的图像保持一致。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">本文将这一思想与贝叶斯变分推断结合，形成两次前向传播机制。第一次前向传播从原始 Mosaic/PAN 观测估计 HR-HSI，并通过退化函数保证与原始观测一致；第二次前向传播则将第一次结果经过几何变换后作为新的参考约束，要求模型在变换后仍能得到一致重建。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种设计的关键意义在于：它在没有 HR-HSI 真值的情况下，为网络提供了额外监督信号。观测一致性约束可以保证输出能够解释输入，等变一致性约束则可以帮助模型跳出退化算子的 range space，减少逆问题中的多解性，使模型学习到更稳健的高光谱结构表示。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">论文最终使用的损失由五部分组成：</span></p><p><i><span leaf="">y</span></i><span leaf=""> = </span><i><span leaf="">L</span></i><sub style="line-height: 0;"><span leaf="">y</span></sub><span leaf=""> + </span><i><span leaf="">L</span></i><sub style="line-height: 0;"><span leaf="">z</span></sub><span leaf=""> + </span><i><span leaf="">L</span></i><sub style="line-height: 0;"><span leaf="">u</span></sub><span leaf=""> + </span><i><span leaf="">L</span></i><sub style="line-height: 0;"><span leaf="">ny</span></sub><span leaf=""> + </span><i><span leaf="">L</span></i><sub style="line-height: 0;"><span leaf="">nz</span></sub></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><i><span leaf="">L</span></i><sub style="line-height: 0;"><span leaf="">y</span></sub><span leaf=""> 和 </span><i><span leaf="">L</span></i><sub style="line-height: 0;"><span leaf="">z</span></sub><span leaf=""> 保证 PAN 与 Mosaic 的观测一致性，</span><i><span leaf="">L</span></i><sub style="line-height: 0;"><span leaf="">u</span></sub><span leaf=""> 对应等变一致性，</span><i><span leaf="">L</span></i><sub style="line-height: 0;"><span leaf="">ny</span></sub><span leaf=""> 和 </span><i><span leaf="">L</span></i><sub style="line-height: 0;"><span leaf="">nz</span></sub><span leaf=""> 用于约束噪声建模。消融实验显示，只有观测一致性时模型性能有限；加入噪声相关损失和 EI 相关损失后，模型在模拟数据和真实数据上均得到明显提升；完整损失组合取得总体最优结果。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">📊 实验结果</span></span></h2><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 模拟和真实数据集定量评价结果</span></span></h3><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="表1 模拟与真实数据集上的定量对比结果" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175751" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.32314814814814813" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=06037f3e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibWgoPSkDETwGn6REyEibiacibvfmiaXMT79bB6IBriaKXkMLa3miaE6icLAHYSxxgUGasdaY2ULAfWEMcyfibSn07NwdQt3dmMXhmmU70%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">表1 模拟与真实数据集上的定量对比结果</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 模拟数据集定性评价结果</span></span></h3><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图7 CAVE数据集上融合方法的视觉比较。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175752" data-type="jpeg" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.3194444444444444" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=b81fa20a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGW8vPYwxibQVyGlmTkmZ2dibbdtib5iaruzpv71HiaDBpUUJZ3Fr45Nju9Jr9miakbuCKLXTTteiaucKYHBpGg16r0GIShjPM81ulhUzjY%2F640%3Fwx_fmt%3Djpeg%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图7 CAVE数据集上融合方法的视觉比较。</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 真实数据集定性评价结果</span></span></h3><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图8 真实数据集上融合方法的视觉比较。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175755" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.27870370370370373" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=48cb7889&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9mbKdVccZNjl943t6VxFMbriat2ONRJYlrC0QMGu81ibOI0p9VpNKLNcPQn71GDzALFAH7acDsicevIK9gl1mZY7AnDEAiavhwjDk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图8 真实数据集上融合方法的视觉比较。</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">✨ 结论</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这篇论文围绕 Mosaic/PAN 双输入高分辨率高光谱重建问题，提出了一套具有清晰物理含义和较强统计建模能力的等变贝叶斯变分推断框架。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">与传统两阶段“去马赛克 + 全色锐化”流程相比，该方法从 HR-HSI 本身的结构出发，将目标图像分解为主成分和稀疏残差，并通过共享 DNN 进行估计，使重建过程更具可解释性。该工作可迁移至其它图像复原任务。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175754" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.125" data-w="960" src="https://wechat2rss.xlab.app/img-proxy/?k=63b57f41&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW8SErMHj7OltibCAYaQnf0CjnHzkWIkVa9icoibMiat2GfMPbDDYQHwqYj9BJK4LL16fPiatwW4taZSbozIGMv6ApFLz7FXJV4iaJibicI%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175756" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7064814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=95ed25ca&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9bBArzs4kSEjtxeVJeztIEopq6NhbJdBA3sCysCnJict36b6V9TW2lpJMC6cWa4Nhzcu5DcsmbiblXk4VmSOicqsccToicDCDnZhU%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=b7d92874&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659419%26idx%3D1%26sn%3D87a3983698c4b5b339ff737ead513031">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Sun, 10 May 2026 07:05:00 +0800</pubDate>
    </item>
    <item>
      <title>TPAMI 2026 北航&amp;清华联合提出连续时空隐式神经场 SINF：面向无监督视频去噪的连续视觉建模新范式</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659418&amp;idx=1&amp;sn=780633209d8f780b651773536c4ec989</link>
      <description></description>
      <content:encoded><![CDATA[<p>原创 <span>52CV</span> <span>2026-05-09 23:31</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=236452da&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGW9WPExVvrokJpPsAIHKSJibsQrSNFj1NdYWKFRxJk1ib8CnB36JmtSYoPA1np2nQ4iaesaoY18e68fE5YeDVYvzOSWWExP6wziaQxk%2F0%3Fwx_fmt%3Djpeg"/></p>
  
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.2778649921507064" data-type="gif" data-w="637" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175728" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=e54fb367&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGW9h43DJCO9GRTKzf2I5nicCnzibsuvydRsZUuveTeib26IkzTnCdia9XOLSqYgzmHibwNBnTD1eFW2iaAdqJrHzUwnUlvEKUPDsAsicEc%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">近年来，随着人工智能、计算机视觉与科学计算成像的快速发展，视频去噪（Video Denoising）已经成为低层视觉（Low-level Vision）领域中的核心基础问题之一。从自动驾驶、智能监控、移动终端夜景增强，到生物医学显微成像、天文观测以及 AI for Science 等前沿方向，高质量的视频恢复能力正在成为智能视觉系统的重要基础支撑。然而，在真实场景下，视频往往伴随着复杂噪声、动态运动以及多种退化耦合，仅依赖传统监督学习的方法，已经越来越难以满足复杂真实环境中的应用需求。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">近期，北京航空航天大学与清华大学联合完成的研究成果 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">《Learning Continuous Spatiotemporal Implicit Neural Fields for Unsupervised Video Denoising》 </span></code></strong><span leaf=""> 被国际人工智能与计算机视觉顶级期刊 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">IEEE Transactions on Pattern Analysis and Machine Intelligence（IEEE TPAMI）</span></strong><span leaf=""> 正式接收发表。该工作提出了一种全新的连续时空隐式神经场框架 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Spatiotemporal Implicit Neural Field（SINF）</span></strong><span leaf="">，首次将连续隐式神经表示系统性引入无监督视频去噪任务，为复杂动态场景中的视频恢复问题提供了新的理论视角与技术路线。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">论文链接：<a href="https://ieeexplore.ieee.org/document/11471067" target="_blank">https://ieeexplore.ieee.org/document/11471067</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">代码链接：<a href="https://github.com/Huxiaowan/SINF-VDN" target="_blank">https://github.com/Huxiaowan/SINF-VDN</a></span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">论文围绕</span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">“视频是否应仅被视为离散帧序列”</span></code><span leaf="">这一基本问题展开重新思考。传统视频去噪方法大多基于固定像素网格和离散时间序列建模：空间维度依赖卷积网络提取局部邻域信息，时间维度依赖 RNN、Transformer 或光流估计建立跨帧关联。然而，真实视频本质上并不是静态图像帧的简单堆叠，而是连续场景在空间和时间上的动态演化。相机或显微成像设备所获得的视频序列，只是这一连续时空场在有限空间分辨率和有限时间采样率下的离散观测。因此，当模型始终被限制在离散网格上进行表示、对齐与恢复时，其对复杂运动、高频纹理和连续结构变化的表达能力必然受到限制。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">针对这一核心瓶颈，SINF 将无监督视频去噪重新表述为</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">一个连续时空隐式场学习问题</span></strong><span leaf="">。该方法不再仅将视频看作离散帧集合，而是将其建模为一个连续可微的时空函数，通过坐标驱动的隐式神经表示直接学习空间坐标、时间坐标与视频强度之间的映射关系。与传统 CNN 或 RNN 方法相比，SINF 在理论上能够突破固定感受野、离散采样和光流对齐的局限，实现更稳定的时空一致性、更强的高频细节恢复能力以及更鲁棒的真实噪声适应能力。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="SINF整体框架示意图" class="rich_pages wxw-img" data-ratio="0.47685185185185186" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175730" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=6fdfeb84&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9IIZXWsI1mr2micT6YAHI3f8eeHAVQpJN3mVoN6gjFElN5F58pQI85eRtwmgyt8e1vMH2Uf9iaMc6uuoVQ8A5Xz4EHkRLia9jc4s%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">SINF整体框架示意图</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">一、研究背景：为什么真实视频去噪越来越困难？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">视频去噪本质上是一个从受噪声污染的视频观测中恢复真实场景信号的问题。对于单帧图像而言，去噪模型主要关注空间纹理、边缘结构和局部语义之间的关系；而对于视频而言，模型不仅需要恢复每一帧中的空间细节，还必须保持相邻帧之间的运动连续性和时间一致性。因此，视频去噪的难点并不只是“去除噪声”，更在于如何在复杂运动条件下区分噪声扰动和真实动态结构。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在真实成像系统中，视频噪声往往并非简单的独立同分布高斯噪声，而是与成像条件、传感器特性、曝光时间、光照强度、运动速度和压缩方式密切相关。例如，在低照度视频中，信号强度本身较弱，光子噪声和传感器读出噪声会显著影响图像质量；在高速运动或动态场景中，目标位置变化会破坏简单的跨帧像素对应关系；在生物显微成像中，为了降低光毒性和光漂白，常常需要在极低光子条件下采集视频，导致信噪比显著降低；在科学计算成像与医学成像中，真实 Ground Truth 往往无法获得，进一步限制了监督学习方法的应用。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">传统监督视频去噪方法通常需要大量成对的噪声视频和干净视频作为训练样本。对于合成噪声数据集而言，这一假设相对容易满足，因为研究者可以在干净视频上人工添加噪声，构造训练数据。但在真实世界中，严格对齐的干净/噪声视频对非常难以获得。动态场景不可重复，噪声过程不可逆，真实干净视频通常无法直接采集。因此，监督学习方法虽然在标准数据集上表现良好，但在真实噪声、未知噪声分布和复杂动态场景中往往面临泛化不足的问题。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">无监督视频去噪由此成为近年来低层视觉研究中的重要方向。该类方法希望仅依赖噪声视频本身完成模型训练，而不需要干净标签。早期方法借鉴 Noise2Noise、Noise2Void 等自监督图像去噪思想，通过噪声独立性假设、中心像素遮挡或跨帧构造伪监督信号实现训练。随着视频建模的发展，现有无监督视频去噪逐渐形成两类主流范式：一类是基于帧间配准的方法，通过光流或运动补偿构造跨帧训练对；另一类是基于 blind-spot 的时空建模方法，通过遮挡中心像素避免网络学习恒等映射。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">尽管这些方法推动了无监督视频去噪的发展，但在强噪声和复杂运动场景中仍存在明显不足。基于光流的方法依赖准确的运动估计，而光流估计本身高度依赖图像梯度和纹理结构。当输入视频已经被强噪声污染时，梯度信息会被破坏，光流估计容易产生错误。一旦错误的光流被用于跨帧对齐，误差会在时间维度上进一步传播，最终表现为运动伪影、边缘错位和时序闪烁。另一方面，blind-spot 方法虽然能够实现无监督训练，但传统 blind-spot 网络主要基于局部卷积感受野进行恢复，中心像素被遮挡后，模型只能利用有限邻域推断目标像素，难以充分恢复细粒度纹理和长距离结构关系。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">因此，论文指出，当前无监督视频去噪方法的根本瓶颈并不仅仅在于网络结构不够复杂，而在于其视频表示方式仍然建立在离散空间网格和离散时间帧序列的基础之上。只要模型仍然依赖固定像素网格、有限邻域卷积和噪声敏感的光流估计，就很难真正实现鲁棒、连续和全局一致的视频恢复。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">二、核心问题：视频应被看作离散帧序列，还是连续时空场？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">论文的出发点是对视频表示方式的重新审视。传统视频处理方法通常将视频表示为一个离散帧序列：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathcal{V=\{} I_t\}^T_{t=1},I_t∈\mathrm{ℝ}^{H×W×3}
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -896 10942 1200.9" aria-hidden="true" style="max-width: 300%;vertical-align: -0.69ex;width: 24.756ex;height: 2.717ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="56" d="M25 633Q25 647 47 665T100 683Q291 683 291 306Q291 264 288 213T282 132L279 102Q281 102 308 126T378 191T464 279T545 381T596 479Q600 490 600 502Q600 527 581 550T523 577Q505 577 505 601Q505 622 516 647T542 681Q546 683 558 683Q605 679 631 645T658 559Q658 423 487 215Q409 126 308 37T190 -52Q177 -52 177 -28Q177 -26 183 15T196 127T203 270Q203 356 192 421T165 523T126 583T83 613T41 620Q25 620 25 633Z"></path></g><g data-mml-node="mo" transform="translate(935.8, 0)"><path data-c="3D" d="M776 357T776 347T761 327H470Q180 327 176 329Q164 334 164 347Q164 359 176 365Q179 367 470 367H761Q776 357 776 347ZM116 143T116 153T131 173H422Q713 173 717 171Q728 166 728 153T717 135Q713 133 422 133H131Q116 143 116 153Z"></path></g><g data-mml-node="mo" transform="translate(1980.6, 0)"><path data-c="7B" d="M434 -231Q434 -244 428 -250H410Q281 -250 230 -184Q225 -177 222 -172T217 -161T213 -148T211 -133T210 -111T209 -84T209 -47T209 0Q209 21 209 53Q208 142 204 153Q203 154 203 155Q189 191 153 211T82 231Q71 231 68 234T65 250T68 266T82 269Q116 269 152 289T203 345Q208 356 208 377T209 529V579Q209 634 215 656T244 698Q270 724 324 740Q361 748 377 749Q379 749 390 749T408 750H428Q434 744 434 732Q434 719 431 716Q429 713 415 713Q362 710 332 689T296 647Q291 634 291 499V417Q291 370 288 353T271 314Q240 271 184 255L170 250L184 245Q202 239 220 230T262 196T290 137Q291 131 291 1Q291 -134 296 -147Q306 -174 339 -192T415 -213Q429 -213 431 -216Q434 -219 434 -231Z"></path></g></g><g data-mml-node="msub" transform="translate(2480.6, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="mi" transform="translate(440, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="msubsup" transform="translate(3225.8, 0)"><g data-mml-node="mo"><path data-c="7D" d="M65 731Q65 745 68 747T88 750Q171 750 216 725T279 670Q288 649 289 635T291 501Q292 362 293 357Q306 312 345 291T417 269Q428 269 431 266T434 250T431 234T417 231Q380 231 345 210T298 157Q293 143 292 121T291 -28V-79Q291 -134 285 -156T256 -198Q202 -250 89 -250Q71 -250 68 -247T65 -230Q65 -224 65 -223T66 -218T69 -214T77 -213Q91 -213 108 -210T146 -200T183 -177T207 -139Q208 -134 209 3L210 139Q223 196 280 230Q315 247 330 250Q305 257 280 270Q225 304 212 352L210 362L209 498Q208 635 207 640Q195 680 154 696T77 713Q68 713 67 716T65 731Z"></path></g><g data-mml-node="mi" transform="translate(500, 413) scale(0.707)"><path data-c="54" d="M40 437Q21 437 21 445Q21 450 37 501T71 602L88 651Q93 669 101 677H569H659Q691 677 697 676T704 667Q704 661 687 553T668 444Q668 437 649 437Q640 437 637 437T631 442L629 445Q629 451 635 490T641 551Q641 586 628 604T573 629Q568 630 515 631Q469 631 457 630T439 622Q438 621 368 343T298 60Q298 48 386 46Q418 46 427 45T436 36Q436 31 433 22Q429 4 424 1L422 0Q419 0 415 0Q410 0 363 1T228 2Q99 2 64 0H49Q43 6 43 9T45 27Q49 40 55 46H83H94Q174 46 189 55Q190 56 191 56Q196 59 201 76T241 233Q258 301 269 344Q339 619 339 625Q339 630 310 630H279Q212 630 191 624Q146 614 121 583T67 467Q60 445 57 441T43 437H40Z"></path></g><g data-mml-node="TeXAtom" transform="translate(500, -247) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(1139, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g><g data-mml-node="mo" transform="translate(4934.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(5379.4, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="mi" transform="translate(440, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(6402.5, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="msup" transform="translate(7347.3, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="211D" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g></g><g data-mml-node="TeXAtom" transform="translate(722, 413) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="48" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 219 683Q260 681 355 681Q389 681 418 681T463 682T483 682Q499 682 499 672Q499 670 497 658Q492 641 487 638H485Q483 638 480 638T473 638T464 637T455 637Q416 636 405 634T387 623Q384 619 355 500Q348 474 340 442T328 395L324 380Q324 378 469 378H614L615 381Q615 384 646 504Q674 619 674 627T617 637Q594 637 587 639T580 648Q580 650 582 660Q586 677 588 679T604 682Q609 682 646 681T740 680Q802 680 835 681T871 682Q888 682 888 672Q888 645 876 638H874Q872 638 869 638T862 638T853 637T844 637Q805 636 794 634T776 623Q773 618 704 340T634 58Q634 51 638 51Q646 48 692 46H723Q729 38 729 37T726 19Q722 6 716 0H701Q664 2 567 2Q533 2 504 2T458 2T437 1Q420 1 420 10Q420 15 423 24Q428 43 433 45Q437 46 448 46H454Q481 46 514 49Q520 50 522 50T528 55T534 64T540 82T547 110T558 153Q565 181 569 198Q602 330 602 331T457 332H312L279 197Q245 63 245 58Q245 51 253 49T303 46H334Q340 38 340 37T337 19Q333 6 327 0H312Q275 2 178 2Q144 2 115 2T69 2T48 1Q31 1 31 10Q31 12 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mo" transform="translate(888, 0)"><path data-c="D7" d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path></g><g data-mml-node="mi" transform="translate(1666, 0)"><path data-c="57" d="M436 683Q450 683 486 682T553 680Q604 680 638 681T677 682Q695 682 695 674Q695 670 692 659Q687 641 683 639T661 637Q636 636 621 632T600 624T597 615Q597 603 613 377T629 138L631 141Q633 144 637 151T649 170T666 200T690 241T720 295T759 362Q863 546 877 572T892 604Q892 619 873 628T831 637Q817 637 817 647Q817 650 819 660Q823 676 825 679T839 682Q842 682 856 682T895 682T949 681Q1015 681 1034 683Q1048 683 1048 672Q1048 666 1045 655T1038 640T1028 637Q1006 637 988 631T958 617T939 600T927 584L923 578L754 282Q586 -14 585 -15Q579 -22 561 -22Q546 -22 542 -17Q539 -14 523 229T506 480L494 462Q472 425 366 239Q222 -13 220 -15T215 -19Q210 -22 197 -22Q178 -22 176 -15Q176 -12 154 304T131 622Q129 631 121 633T82 637H58Q51 644 51 648Q52 671 64 683H76Q118 680 176 680Q301 680 313 683H323Q329 677 329 674T327 656Q322 641 318 637H297Q236 634 232 620Q262 160 266 136L501 550L499 587Q496 629 489 632Q483 636 447 637Q428 637 422 639T416 648Q416 650 418 660Q419 664 420 669T421 676T424 680T428 682T436 683Z"></path></g><g data-mml-node="mo" transform="translate(2714, 0)"><path data-c="D7" d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path></g><g data-mml-node="mn" transform="translate(3492, 0)"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path></g></g></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在这一表示中，每一帧 </span><span style="cursor:pointer;" data-formula="I_t"><span data-formula="I_t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 745.3 840.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 1.686ex;height: 1.902ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="mi" transform="translate(440, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 是一个固定分辨率的二维像素网格，时间维度则由有限帧索引 </span><span style="cursor:pointer;" data-formula="t"><span data-formula="t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -626 361 637" aria-hidden="true" style="vertical-align: -0.025ex;width: 0.817ex;height: 1.441ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 表示。这种建模方式符合数字视频的存储形式，却未必符合真实场景的物理本质。真实世界中的光照、运动和结构变化是连续发生的，数字视频只是成像设备对连续时空光照场的采样结果。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="(a)视频作为连续光照场的离散样本 (b)离散视频的连续时空与频谱隐式场" class="rich_pages wxw-img" data-ratio="0.9111111111111111" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175726" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=1df5ea80&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicYOEXzHRyLKOuO0ynOqE7RRav5KIrorLYzVA5ibY4GKQUI9AzQ7HjNP9wASqeS3lo2bGIC8S2LTH27MJL6tQIIEBlPlGk7kgNE%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">(a)视频作为连续光照场的离散样本 (b)离散视频的连续时空与频谱隐式场</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">论文在 Preliminary 部分首先给出了连续视频建模的基本形式。理想视频信号可以被表示为一个连续时空光照场：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="L(x,y,t):\mathrm{ℝ}^2×\mathrm{ℝ}→\mathrm{ℝ}^3,
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -883.9 10634 1133.9" aria-hidden="true" style="max-width: 300%;vertical-align: -0.566ex;width: 24.059ex;height: 2.565ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="4C" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 217 683Q271 680 344 680Q485 680 506 683H518Q524 677 524 674T522 656Q517 641 513 637H475Q406 636 394 628Q387 624 380 600T313 336Q297 271 279 198T252 88L243 52Q243 48 252 48T311 46H328Q360 46 379 47T428 54T478 72T522 106T564 161Q580 191 594 228T611 270Q616 273 628 273H641Q647 264 647 262T627 203T583 83T557 9Q555 4 553 3T537 0T494 -1Q483 -1 418 -1T294 0H116Q32 0 32 10Q32 17 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mo" transform="translate(681, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1070, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(1642, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(2086.7, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(2576.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(3021.3, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(3382.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(4049.1, 0)"><path data-c="3A" d="M78 370Q78 394 95 412T138 430Q162 430 180 414T199 371Q199 346 182 328T139 310T96 327T78 370ZM78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g><g data-mml-node="msup" transform="translate(4604.9, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="211D" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g></g><g data-mml-node="mn" transform="translate(722, 413) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="mo" transform="translate(5952.7, 0)"><path data-c="D7" d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(6952.9, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="211D" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g></g><g data-mml-node="mo" transform="translate(7952.7, 0)"><path data-c="2192" d="M56 237T56 250T70 270H835Q719 357 692 493Q692 494 692 496T691 499Q691 511 708 511H711Q720 511 723 510T729 506T732 497T735 481T743 456Q765 389 816 336T935 261Q944 258 944 250Q944 244 939 241T915 231T877 212Q836 186 806 152T761 85T740 35T732 4Q730 -6 727 -8T711 -11Q691 -11 691 0Q691 7 696 25Q728 151 835 230H70Q56 237 56 250Z"></path></g><g data-mml-node="msup" transform="translate(9230.4, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="211D" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g></g><g data-mml-node="mn" transform="translate(722, 413) scale(0.707)"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path></g></g><g data-mml-node="mo" transform="translate(10356, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中，</span><span style="cursor:pointer;" data-formula="(x,y)"><span data-formula="(x,y)"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2284.7 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 5.169ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(961, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1405.7, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1895.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 是连续空间坐标，</span><span style="cursor:pointer;" data-formula="t"><span data-formula="t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -626 361 637" aria-hidden="true" style="vertical-align: -0.025ex;width: 0.817ex;height: 1.441ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 是连续时间，输出 </span><span style="cursor:pointer;" data-formula="\mathrm{ℝ}^3"><span data-formula="\mathrm{ℝ}^3"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -880.3 1125.6 880.3" aria-hidden="true" style="vertical-align: 0px;width: 2.547ex;height: 1.992ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="211D" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g></g><g data-mml-node="mn" transform="translate(722, 410.1) scale(0.707)"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 表示 RGB 强度。实际采集到的视频帧可以表示为该连续函数在离散空间—时间格点上的采样：</span><span style="cursor:pointer;" data-formula="V(i,j,k)=L(x_j,y_k,t_i),"><span data-formula="V(i,j,k)=L(x_j,y_k,t_i),"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 10150.9 1044.2" aria-hidden="true" style="vertical-align: -0.666ex;width: 22.966ex;height: 2.363ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="56" d="M52 648Q52 670 65 683H76Q118 680 181 680Q299 680 320 683H330Q336 677 336 674T334 656Q329 641 325 637H304Q282 635 274 635Q245 630 242 620Q242 618 271 369T301 118L374 235Q447 352 520 471T595 594Q599 601 599 609Q599 633 555 637Q537 637 537 648Q537 649 539 661Q542 675 545 679T558 683Q560 683 570 683T604 682T668 681Q737 681 755 683H762Q769 676 769 672Q769 655 760 640Q757 637 743 637Q730 636 719 635T698 630T682 623T670 615T660 608T652 599T645 592L452 282Q272 -9 266 -16Q263 -18 259 -21L241 -22H234Q216 -22 216 -15Q213 -9 177 305Q139 623 138 626Q133 637 76 637H59Q52 642 52 648Z"></path></g><g data-mml-node="mo" transform="translate(769, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1158, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1503, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1947.7, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g><g data-mml-node="mo" transform="translate(2359.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(2804.3, 0)"><path data-c="6B" d="M121 647Q121 657 125 670T137 683Q138 683 209 688T282 694Q294 694 294 686Q294 679 244 477Q194 279 194 272Q213 282 223 291Q247 309 292 354T362 415Q402 442 438 442Q468 442 485 423T503 369Q503 344 496 327T477 302T456 291T438 288Q418 288 406 299T394 328Q394 353 410 369T442 390L458 393Q446 405 434 405H430Q398 402 367 380T294 316T228 255Q230 254 243 252T267 246T293 238T320 224T342 206T359 180T365 147Q365 130 360 106T354 66Q354 26 381 26Q429 26 459 145Q461 153 479 153H483Q499 153 499 144Q499 139 496 130Q455 -11 378 -11Q333 -11 305 15T277 90Q277 108 280 121T283 145Q283 167 269 183T234 206T200 217T182 220H180Q168 178 159 139T145 81T136 44T129 20T122 7T111 -2Q98 -11 83 -11Q66 -11 57 -1T48 16Q48 26 85 176T158 471L195 616Q196 629 188 632T149 637H144Q134 637 131 637T124 640T121 647Z"></path></g><g data-mml-node="mo" transform="translate(3325.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(3992.1, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mi" transform="translate(5047.9, 0)"><path data-c="4C" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 217 683Q271 680 344 680Q485 680 506 683H518Q524 677 524 674T522 656Q517 641 513 637H475Q406 636 394 628Q387 624 380 600T313 336Q297 271 279 198T252 88L243 52Q243 48 252 48T311 46H328Q360 46 379 47T428 54T478 72T522 106T564 161Q580 191 594 228T611 270Q616 273 628 273H641Q647 264 647 262T627 203T583 83T557 9Q555 4 553 3T537 0T494 -1Q483 -1 418 -1T294 0H116Q32 0 32 10Q32 17 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mo" transform="translate(5728.9, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(6117.9, 0)"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mi" transform="translate(572, -150) scale(0.707)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g><g data-mml-node="mo" transform="translate(7031.2, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(7475.9, 0)"><g data-mml-node="mi"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(490, -150) scale(0.707)"><path data-c="6B" d="M121 647Q121 657 125 670T137 683Q138 683 209 688T282 694Q294 694 294 686Q294 679 244 477Q194 279 194 272Q213 282 223 291Q247 309 292 354T362 415Q402 442 438 442Q468 442 485 423T503 369Q503 344 496 327T477 302T456 291T438 288Q418 288 406 299T394 328Q394 353 410 369T442 390L458 393Q446 405 434 405H430Q398 402 367 380T294 316T228 255Q230 254 243 252T267 246T293 238T320 224T342 206T359 180T365 147Q365 130 360 106T354 66Q354 26 381 26Q429 26 459 145Q461 153 479 153H483Q499 153 499 144Q499 139 496 130Q455 -11 378 -11Q333 -11 305 15T277 90Q277 108 280 121T283 145Q283 167 269 183T234 206T200 217T182 220H180Q168 178 159 139T145 81T136 44T129 20T122 7T111 -2Q98 -11 83 -11Q66 -11 57 -1T48 16Q48 26 85 176T158 471L195 616Q196 629 188 632T149 637H144Q134 637 131 637T124 640T121 647Z"></path></g></g><g data-mml-node="mo" transform="translate(8384.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(8829, 0)"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mi" transform="translate(361, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(9483.9, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(9872.9, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g></g><g></g></svg></span></span><span leaf="">其中 </span><span style="cursor:pointer;" data-formula="x_j=j⋅\mathrm{Δ} x"><span data-formula="x_j=j⋅\mathrm{Δ} x"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -716 4786.3 1010.2" aria-hidden="true" style="vertical-align: -0.666ex;width: 10.829ex;height: 2.286ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mi" transform="translate(572, -150) scale(0.707)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g><g data-mml-node="mo" transform="translate(1191.1, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mi" transform="translate(2246.9, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g><g data-mml-node="mo" transform="translate(2881.1, 0)"><path data-c="22C5" d="M78 250Q78 274 95 292T138 310Q162 310 180 294T199 251Q199 226 182 208T139 190T96 207T78 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3381.3, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="394" d="M51 0Q46 4 46 7Q46 9 215 357T388 709Q391 716 416 716Q439 716 444 709Q447 705 616 357T786 7Q786 4 781 0H51ZM507 344L384 596L137 92L383 91H630Q630 93 507 344Z"></path></g></g></g><g data-mml-node="mi" transform="translate(4214.3, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g></g></g><g></g></svg></span></span><span leaf="">、</span><span style="cursor:pointer;" data-formula="y_k=k⋅\mathrm{Δ} y"><span data-formula="y_k=k⋅\mathrm{Δ} y"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -716 4808.4 921" aria-hidden="true" style="vertical-align: -0.464ex;width: 10.879ex;height: 2.084ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(490, -150) scale(0.707)"><path data-c="6B" d="M121 647Q121 657 125 670T137 683Q138 683 209 688T282 694Q294 694 294 686Q294 679 244 477Q194 279 194 272Q213 282 223 291Q247 309 292 354T362 415Q402 442 438 442Q468 442 485 423T503 369Q503 344 496 327T477 302T456 291T438 288Q418 288 406 299T394 328Q394 353 410 369T442 390L458 393Q446 405 434 405H430Q398 402 367 380T294 316T228 255Q230 254 243 252T267 246T293 238T320 224T342 206T359 180T365 147Q365 130 360 106T354 66Q354 26 381 26Q429 26 459 145Q461 153 479 153H483Q499 153 499 144Q499 139 496 130Q455 -11 378 -11Q333 -11 305 15T277 90Q277 108 280 121T283 145Q283 167 269 183T234 206T200 217T182 220H180Q168 178 159 139T145 81T136 44T129 20T122 7T111 -2Q98 -11 83 -11Q66 -11 57 -1T48 16Q48 26 85 176T158 471L195 616Q196 629 188 632T149 637H144Q134 637 131 637T124 640T121 647Z"></path></g></g><g data-mml-node="mo" transform="translate(1186.2, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mi" transform="translate(2242, 0)"><path data-c="6B" d="M121 647Q121 657 125 670T137 683Q138 683 209 688T282 694Q294 694 294 686Q294 679 244 477Q194 279 194 272Q213 282 223 291Q247 309 292 354T362 415Q402 442 438 442Q468 442 485 423T503 369Q503 344 496 327T477 302T456 291T438 288Q418 288 406 299T394 328Q394 353 410 369T442 390L458 393Q446 405 434 405H430Q398 402 367 380T294 316T228 255Q230 254 243 252T267 246T293 238T320 224T342 206T359 180T365 147Q365 130 360 106T354 66Q354 26 381 26Q429 26 459 145Q461 153 479 153H483Q499 153 499 144Q499 139 496 130Q455 -11 378 -11Q333 -11 305 15T277 90Q277 108 280 121T283 145Q283 167 269 183T234 206T200 217T182 220H180Q168 178 159 139T145 81T136 44T129 20T122 7T111 -2Q98 -11 83 -11Q66 -11 57 -1T48 16Q48 26 85 176T158 471L195 616Q196 629 188 632T149 637H144Q134 637 131 637T124 640T121 647Z"></path></g><g data-mml-node="mo" transform="translate(2985.2, 0)"><path data-c="22C5" d="M78 250Q78 274 95 292T138 310Q162 310 180 294T199 251Q199 226 182 208T139 190T96 207T78 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3485.4, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="394" d="M51 0Q46 4 46 7Q46 9 215 357T388 709Q391 716 416 716Q439 716 444 709Q447 705 616 357T786 7Q786 4 781 0H51ZM507 344L384 596L137 92L383 91H630Q630 93 507 344Z"></path></g></g></g><g data-mml-node="mi" transform="translate(4318.4, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g></g><g></g></svg></span></span><span leaf="">、</span><span style="cursor:pointer;" data-formula="t_i=i⋅\mathrm{Δ} t"><span data-formula="t_i=i⋅\mathrm{Δ} t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -716 4250 873.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 9.615ex;height: 1.977ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mi" transform="translate(361, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(932.7, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mi" transform="translate(1988.5, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(2555.7, 0)"><path data-c="22C5" d="M78 250Q78 274 95 292T138 310Q162 310 180 294T199 251Q199 226 182 208T139 190T96 207T78 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3056, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="394" d="M51 0Q46 4 46 7Q46 9 215 357T388 709Q391 716 416 716Q439 716 444 709Q447 705 616 357T786 7Q786 4 781 0H51ZM507 344L384 596L137 92L383 91H630Q630 93 507 344Z"></path></g></g></g><g data-mml-node="mi" transform="translate(3889, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g></g></svg></span></span><span leaf="">，</span><span style="cursor:pointer;" data-formula="\mathrm{Δ} x,\mathrm{Δ} y,\mathrm{Δ} t"><span data-formula="\mathrm{Δ} x,\mathrm{Δ} y,\mathrm{Δ} t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -716 4811.3 921" aria-hidden="true" style="vertical-align: -0.464ex;width: 10.885ex;height: 2.084ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="394" d="M51 0Q46 4 46 7Q46 9 215 357T388 709Q391 716 416 716Q439 716 444 709Q447 705 616 357T786 7Q786 4 781 0H51ZM507 344L384 596L137 92L383 91H630Q630 93 507 344Z"></path></g></g></g><g data-mml-node="mi" transform="translate(833, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(1405, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1849.7, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="394" d="M51 0Q46 4 46 7Q46 9 215 357T388 709Q391 716 416 716Q439 716 444 709Q447 705 616 357T786 7Q786 4 781 0H51ZM507 344L384 596L137 92L383 91H630Q630 93 507 344Z"></path></g></g></g><g data-mml-node="mi" transform="translate(2682.7, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(3172.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3617.3, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="394" d="M51 0Q46 4 46 7Q46 9 215 357T388 709Q391 716 416 716Q439 716 444 709Q447 705 616 357T786 7Q786 4 781 0H51ZM507 344L384 596L137 92L383 91H630Q630 93 507 344Z"></path></g></g></g><g data-mml-node="mi" transform="translate(4450.3, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 分别为空间和时间采样间隔。也就是说，视频序列本质上只是连续时空场的有限采样，而不是连续场本身。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从函数逼近角度看，离散视频可以被理解为连续函数空间 </span><span style="cursor:pointer;" data-formula="\mathcal{F}"><span data-formula="\mathcal{F}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 829 715" aria-hidden="true" style="vertical-align: -0.072ex;width: 1.876ex;height: 1.618ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="46" d="M199 579Q181 579 181 590Q181 598 188 611T212 639T260 666T335 682Q336 682 349 682T383 682T431 682T493 683T561 683Q776 682 784 681Q826 673 829 647Q829 620 797 600T744 580Q728 580 728 595Q729 607 713 610Q698 613 598 614H500L499 610Q499 598 467 486T428 367Q428 365 551 365H674Q683 360 684 355Q687 346 677 329Q666 312 642 299T598 285Q586 285 582 296H402L394 277Q386 258 373 229T346 167T315 102T286 51Q265 22 225 -5T133 -32Q108 -32 87 -25T54 -7T33 15T21 35T18 47Q18 60 44 80T98 103Q108 103 111 101T119 88Q130 66 150 54T179 39T195 37Q199 37 203 43Q217 67 245 125T318 300T391 532Q393 543 398 564T406 598T409 613T339 614H269Q229 579 199 579Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 到有限维子空间 </span><span style="cursor:pointer;" data-formula="\mathcal{F}_N"><span data-formula="\mathcal{F}_N"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 1396.9 833" aria-hidden="true" style="vertical-align: -0.339ex;width: 3.16ex;height: 1.885ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="46" d="M199 579Q181 579 181 590Q181 598 188 611T212 639T260 666T335 682Q336 682 349 682T383 682T431 682T493 683T561 683Q776 682 784 681Q826 673 829 647Q829 620 797 600T744 580Q728 580 728 595Q729 607 713 610Q698 613 598 614H500L499 610Q499 598 467 486T428 367Q428 365 551 365H674Q683 360 684 355Q687 346 677 329Q666 312 642 299T598 285Q586 285 582 296H402L394 277Q386 258 373 229T346 167T315 102T286 51Q265 22 225 -5T133 -32Q108 -32 87 -25T54 -7T33 15T21 35T18 47Q18 60 44 80T98 103Q108 103 111 101T119 88Q130 66 150 54T179 39T195 37Q199 37 203 43Q217 67 245 125T318 300T391 532Q393 543 398 564T406 598T409 613T339 614H269Q229 579 199 579Z"></path></g></g><g data-mml-node="mi" transform="translate(719, -150) scale(0.707)"><path data-c="4E" d="M234 637Q231 637 226 637Q201 637 196 638T191 649Q191 676 202 682Q204 683 299 683Q376 683 387 683T401 677Q612 181 616 168L670 381Q723 592 723 606Q723 633 659 637Q635 637 635 648Q635 650 637 660Q641 676 643 679T653 683Q656 683 684 682T767 680Q817 680 843 681T873 682Q888 682 888 672Q888 650 880 642Q878 637 858 637Q787 633 769 597L620 7Q618 0 599 0Q585 0 582 2Q579 5 453 305L326 604L261 344Q196 88 196 79Q201 46 268 46H278Q284 41 284 38T282 19Q278 6 272 0H259Q228 2 151 2Q123 2 100 2T63 2T46 1Q31 1 31 10Q31 14 34 26T39 40Q41 46 62 46Q130 49 150 85Q154 91 221 362L289 634Q287 635 234 637Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 的投影：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathrm{Π}_{\mathcal{F}_N} L=\sum\limits^P_{p=1}{} c_p ϕ_p(x,y,t),
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1733 10467.7 3058.1" aria-hidden="true" style="max-width: 300%;vertical-align: -2.998ex;width: 23.683ex;height: 6.919ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="3A0" d="M128 619Q121 626 117 628T101 631T58 634H25V680H724V634H691Q651 633 640 631T622 619V61Q628 51 639 49T691 46H724V0H713Q692 3 569 3Q434 3 425 0H414V46H447Q489 47 498 49T517 61V634H232V348L233 61Q239 51 250 49T302 46H335V0H324Q303 3 180 3Q45 3 36 0H25V46H58Q100 47 109 49T128 61V619Z"></path></g></g></g><g data-mml-node="TeXAtom" transform="translate(750, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="46" d="M199 579Q181 579 181 590Q181 598 188 611T212 639T260 666T335 682Q336 682 349 682T383 682T431 682T493 683T561 683Q776 682 784 681Q826 673 829 647Q829 620 797 600T744 580Q728 580 728 595Q729 607 713 610Q698 613 598 614H500L499 610Q499 598 467 486T428 367Q428 365 551 365H674Q683 360 684 355Q687 346 677 329Q666 312 642 299T598 285Q586 285 582 296H402L394 277Q386 258 373 229T346 167T315 102T286 51Q265 22 225 -5T133 -32Q108 -32 87 -25T54 -7T33 15T21 35T18 47Q18 60 44 80T98 103Q108 103 111 101T119 88Q130 66 150 54T179 39T195 37Q199 37 203 43Q217 67 245 125T318 300T391 532Q393 543 398 564T406 598T409 613T339 614H269Q229 579 199 579Z"></path></g></g><g data-mml-node="mi" transform="translate(719, -150) scale(0.707)"><path data-c="4E" d="M234 637Q231 637 226 637Q201 637 196 638T191 649Q191 676 202 682Q204 683 299 683Q376 683 387 683T401 677Q612 181 616 168L670 381Q723 592 723 606Q723 633 659 637Q635 637 635 648Q635 650 637 660Q641 676 643 679T653 683Q656 683 684 682T767 680Q817 680 843 681T873 682Q888 682 888 672Q888 650 880 642Q878 637 858 637Q787 633 769 597L620 7Q618 0 599 0Q585 0 582 2Q579 5 453 305L326 604L261 344Q196 88 196 79Q201 46 268 46H278Q284 41 284 38T282 19Q278 6 272 0H259Q228 2 151 2Q123 2 100 2T63 2T46 1Q31 1 31 10Q31 14 34 26T39 40Q41 46 62 46Q130 49 150 85Q154 91 221 362L289 634Q287 635 234 637Z"></path></g></g></g></g><g data-mml-node="mi" transform="translate(1787.8, 0)"><path data-c="4C" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 217 683Q271 680 344 680Q485 680 506 683H518Q524 677 524 674T522 656Q517 641 513 637H475Q406 636 394 628Q387 624 380 600T313 336Q297 271 279 198T252 88L243 52Q243 48 252 48T311 46H328Q360 46 379 47T428 54T478 72T522 106T564 161Q580 191 594 228T611 270Q616 273 628 273H641Q647 264 647 262T627 203T583 83T557 9Q555 4 553 3T537 0T494 -1Q483 -1 418 -1T294 0H116Q32 0 32 10Q32 17 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mo" transform="translate(2746.5, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="munderover" transform="translate(3802.3, 0)"><g data-mml-node="mo"><path data-c="2211" d="M60 948Q63 950 665 950H1267L1325 815Q1384 677 1388 669H1348L1341 683Q1320 724 1285 761Q1235 809 1174 838T1033 881T882 898T699 902H574H543H251L259 891Q722 258 724 252Q725 250 724 246Q721 243 460 -56L196 -356Q196 -357 407 -357Q459 -357 548 -357T676 -358Q812 -358 896 -353T1063 -332T1204 -283T1307 -196Q1328 -170 1348 -124H1388Q1388 -125 1381 -145T1356 -210T1325 -294L1267 -449L666 -450Q64 -450 61 -448Q55 -446 55 -439Q55 -437 57 -433L590 177Q590 178 557 222T452 366T322 544L56 909L55 924Q55 945 60 948Z"></path></g><g data-mml-node="TeXAtom" transform="translate(92.3, -1087.9) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="70" d="M23 287Q24 290 25 295T30 317T40 348T55 381T75 411T101 433T134 442Q209 442 230 378L240 387Q302 442 358 442Q423 442 460 395T497 281Q497 173 421 82T249 -10Q227 -10 210 -4Q199 1 187 11T168 28L161 36Q160 35 139 -51T118 -138Q118 -144 126 -145T163 -148H188Q194 -155 194 -157T191 -175Q188 -187 185 -190T172 -194Q170 -194 161 -194T127 -193T65 -192Q-5 -192 -24 -194H-32Q-39 -187 -39 -183Q-37 -156 -26 -148H-6Q28 -147 33 -136Q36 -130 94 103T155 350Q156 355 156 364Q156 405 131 405Q109 405 94 377T71 316T59 280Q57 278 43 278H29Q23 284 23 287ZM178 102Q200 26 252 26Q282 26 310 49T356 107Q374 141 392 215T411 325V331Q411 405 350 405Q339 405 328 402T306 393T286 380T269 365T254 350T243 336T235 326L232 322Q232 321 229 308T218 264T204 212Q178 106 178 102Z"></path></g><g data-mml-node="mo" transform="translate(503, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(1281, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="mi" transform="translate(456.5, 1150) scale(0.707)"><path data-c="50" d="M287 628Q287 635 230 637Q206 637 199 638T192 648Q192 649 194 659Q200 679 203 681T397 683Q587 682 600 680Q664 669 707 631T751 530Q751 453 685 389Q616 321 507 303Q500 302 402 301H307L277 182Q247 66 247 59Q247 55 248 54T255 50T272 48T305 46H336Q342 37 342 35Q342 19 335 5Q330 0 319 0Q316 0 282 1T182 2Q120 2 87 2T51 1Q33 1 33 11Q33 13 36 25Q40 41 44 43T67 46Q94 46 127 49Q141 52 146 61Q149 65 218 339T287 628ZM645 554Q645 567 643 575T634 597T609 619T560 635Q553 636 480 637Q463 637 445 637T416 636T404 636Q391 635 386 627Q384 621 367 550T332 412T314 344Q314 342 395 342H407H430Q542 342 590 392Q617 419 631 471T645 554Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(5413, 0)"></g><g data-mml-node="msub" transform="translate(5413, 0)"><g data-mml-node="mi"><path data-c="63" d="M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z"></path></g><g data-mml-node="mi" transform="translate(433, -150) scale(0.707)"><path data-c="70" d="M23 287Q24 290 25 295T30 317T40 348T55 381T75 411T101 433T134 442Q209 442 230 378L240 387Q302 442 358 442Q423 442 460 395T497 281Q497 173 421 82T249 -10Q227 -10 210 -4Q199 1 187 11T168 28L161 36Q160 35 139 -51T118 -138Q118 -144 126 -145T163 -148H188Q194 -155 194 -157T191 -175Q188 -187 185 -190T172 -194Q170 -194 161 -194T127 -193T65 -192Q-5 -192 -24 -194H-32Q-39 -187 -39 -183Q-37 -156 -26 -148H-6Q28 -147 33 -136Q36 -130 94 103T155 350Q156 355 156 364Q156 405 131 405Q109 405 94 377T71 316T59 280Q57 278 43 278H29Q23 284 23 287ZM178 102Q200 26 252 26Q282 26 310 49T356 107Q374 141 392 215T411 325V331Q411 405 350 405Q339 405 328 402T306 393T286 380T269 365T254 350T243 336T235 326L232 322Q232 321 229 308T218 264T204 212Q178 106 178 102Z"></path></g></g><g data-mml-node="msub" transform="translate(6251.7, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϕ</tspan></text></g></g><g data-mml-node="mi" transform="translate(442, -235.4) scale(0.707)"><path data-c="70" d="M23 287Q24 290 25 295T30 317T40 348T55 381T75 411T101 433T134 442Q209 442 230 378L240 387Q302 442 358 442Q423 442 460 395T497 281Q497 173 421 82T249 -10Q227 -10 210 -4Q199 1 187 11T168 28L161 36Q160 35 139 -51T118 -138Q118 -144 126 -145T163 -148H188Q194 -155 194 -157T191 -175Q188 -187 185 -190T172 -194Q170 -194 161 -194T127 -193T65 -192Q-5 -192 -24 -194H-32Q-39 -187 -39 -183Q-37 -156 -26 -148H-6Q28 -147 33 -136Q36 -130 94 103T155 350Q156 355 156 364Q156 405 131 405Q109 405 94 377T71 316T59 280Q57 278 43 278H29Q23 284 23 287ZM178 102Q200 26 252 26Q282 26 310 49T356 107Q374 141 392 215T411 325V331Q411 405 350 405Q339 405 328 402T306 393T286 380T269 365T254 350T243 336T235 326L232 322Q232 321 229 308T218 264T204 212Q178 106 178 102Z"></path></g></g><g data-mml-node="mo" transform="translate(7099.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(7488.3, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(8060.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(8505, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(8995, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(9439.7, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(9800.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(10189.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中 </span><span style="cursor:pointer;" data-formula="\{ϕ_p\}"><span data-formula="\{ϕ_p\}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 1847.7 1122.5" aria-hidden="true" style="vertical-align: -0.843ex;width: 4.18ex;height: 2.54ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="7B" d="M434 -231Q434 -244 428 -250H410Q281 -250 230 -184Q225 -177 222 -172T217 -161T213 -148T211 -133T210 -111T209 -84T209 -47T209 0Q209 21 209 53Q208 142 204 153Q203 154 203 155Q189 191 153 211T82 231Q71 231 68 234T65 250T68 266T82 269Q116 269 152 289T203 345Q208 356 208 377T209 529V579Q209 634 215 656T244 698Q270 724 324 740Q361 748 377 749Q379 749 390 749T408 750H428Q434 744 434 732Q434 719 431 716Q429 713 415 713Q362 710 332 689T296 647Q291 634 291 499V417Q291 370 288 353T271 314Q240 271 184 255L170 250L184 245Q202 239 220 230T262 196T290 137Q291 131 291 1Q291 -134 296 -147Q306 -174 339 -192T415 -213Q429 -213 431 -216Q434 -219 434 -231Z"></path></g><g data-mml-node="msub" transform="translate(500, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϕ</tspan></text></g></g><g data-mml-node="mi" transform="translate(442, -235.4) scale(0.707)"><path data-c="70" d="M23 287Q24 290 25 295T30 317T40 348T55 381T75 411T101 433T134 442Q209 442 230 378L240 387Q302 442 358 442Q423 442 460 395T497 281Q497 173 421 82T249 -10Q227 -10 210 -4Q199 1 187 11T168 28L161 36Q160 35 139 -51T118 -138Q118 -144 126 -145T163 -148H188Q194 -155 194 -157T191 -175Q188 -187 185 -190T172 -194Q170 -194 161 -194T127 -193T65 -192Q-5 -192 -24 -194H-32Q-39 -187 -39 -183Q-37 -156 -26 -148H-6Q28 -147 33 -136Q36 -130 94 103T155 350Q156 355 156 364Q156 405 131 405Q109 405 94 377T71 316T59 280Q57 278 43 278H29Q23 284 23 287ZM178 102Q200 26 252 26Q282 26 310 49T356 107Q374 141 392 215T411 325V331Q411 405 350 405Q339 405 328 402T306 393T286 380T269 365T254 350T243 336T235 326L232 322Q232 321 229 308T218 264T204 212Q178 106 178 102Z"></path></g></g><g data-mml-node="mo" transform="translate(1347.7, 0)"><path data-c="7D" d="M65 731Q65 745 68 747T88 750Q171 750 216 725T279 670Q288 649 289 635T291 501Q292 362 293 357Q306 312 345 291T417 269Q428 269 431 266T434 250T431 234T417 231Q380 231 345 210T298 157Q293 143 292 121T291 -28V-79Q291 -134 285 -156T256 -198Q202 -250 89 -250Q71 -250 68 -247T65 -230Q65 -224 65 -223T66 -218T69 -214T77 -213Q91 -213 108 -210T146 -200T183 -177T207 -139Q208 -134 209 3L210 139Q223 196 280 230Q315 247 330 250Q305 257 280 270Q225 304 212 352L210 362L209 498Q208 635 207 640Q195 680 154 696T77 713Q68 713 67 716T65 731Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 表示有限维基函数，</span><span style="cursor:pointer;" data-formula="c_p"><span data-formula="c_p"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 838.7 729.2" aria-hidden="true" style="vertical-align: -0.65ex;width: 1.897ex;height: 1.65ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="63" d="M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z"></path></g><g data-mml-node="mi" transform="translate(433, -150) scale(0.707)"><path data-c="70" d="M23 287Q24 290 25 295T30 317T40 348T55 381T75 411T101 433T134 442Q209 442 230 378L240 387Q302 442 358 442Q423 442 460 395T497 281Q497 173 421 82T249 -10Q227 -10 210 -4Q199 1 187 11T168 28L161 36Q160 35 139 -51T118 -138Q118 -144 126 -145T163 -148H188Q194 -155 194 -157T191 -175Q188 -187 185 -190T172 -194Q170 -194 161 -194T127 -193T65 -192Q-5 -192 -24 -194H-32Q-39 -187 -39 -183Q-37 -156 -26 -148H-6Q28 -147 33 -136Q36 -130 94 103T155 350Q156 355 156 364Q156 405 131 405Q109 405 94 377T71 316T59 280Q57 278 43 278H29Q23 284 23 287ZM178 102Q200 26 252 26Q282 26 310 49T356 107Q374 141 392 215T411 325V331Q411 405 350 405Q339 405 328 402T306 393T286 380T269 365T254 350T243 336T235 326L232 322Q232 321 229 308T218 264T204 212Q178 106 178 102Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 是由采样值决定的系数。由于 </span><span style="cursor:pointer;" data-formula="\mathrm{dim}⁡(\mathcal{F}_N)=P"><span data-formula="\mathrm{dim}⁡(\mathcal{F}_N)=P"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 5926.5 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 13.408ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="64" d="M376 495Q376 511 376 535T377 568Q377 613 367 624T316 637H298V660Q298 683 300 683L310 684Q320 685 339 686T376 688Q393 689 413 690T443 693T454 694H457V390Q457 84 458 81Q461 61 472 55T517 46H535V0Q533 0 459 -5T380 -11H373V44L365 37Q307 -11 235 -11Q158 -11 96 50T34 215Q34 315 97 378T244 442Q319 442 376 393V495ZM373 342Q328 405 260 405Q211 405 173 369Q146 341 139 305T131 211Q131 155 138 120T173 59Q203 26 251 26Q322 26 373 103V342Z"></path></g><g data-mml-node="mi" transform="translate(556, 0)"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path></g><g data-mml-node="mi" transform="translate(834, 0)"><path data-c="6D" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q351 442 364 440T387 434T406 426T421 417T432 406T441 395T448 384T452 374T455 366L457 361L460 365Q463 369 466 373T475 384T488 397T503 410T523 422T546 432T572 439T603 442Q729 442 740 329Q741 322 741 190V104Q741 66 743 59T754 49Q775 46 803 46H819V0H811L788 1Q764 2 737 2T699 3Q596 3 587 0H579V46H595Q656 46 656 62Q657 64 657 200Q656 335 655 343Q649 371 635 385T611 402T585 404Q540 404 506 370Q479 343 472 315T464 232V168V108Q464 78 465 68T468 55T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1667, 0)"><g data-mml-node="mo"><path data-c="2061" d=""></path></g></g><g data-mml-node="mo" transform="translate(1667, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(2056, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="46" d="M199 579Q181 579 181 590Q181 598 188 611T212 639T260 666T335 682Q336 682 349 682T383 682T431 682T493 683T561 683Q776 682 784 681Q826 673 829 647Q829 620 797 600T744 580Q728 580 728 595Q729 607 713 610Q698 613 598 614H500L499 610Q499 598 467 486T428 367Q428 365 551 365H674Q683 360 684 355Q687 346 677 329Q666 312 642 299T598 285Q586 285 582 296H402L394 277Q386 258 373 229T346 167T315 102T286 51Q265 22 225 -5T133 -32Q108 -32 87 -25T54 -7T33 15T21 35T18 47Q18 60 44 80T98 103Q108 103 111 101T119 88Q130 66 150 54T179 39T195 37Q199 37 203 43Q217 67 245 125T318 300T391 532Q393 543 398 564T406 598T409 613T339 614H269Q229 579 199 579Z"></path></g></g><g data-mml-node="mi" transform="translate(719, -150) scale(0.707)"><path data-c="4E" d="M234 637Q231 637 226 637Q201 637 196 638T191 649Q191 676 202 682Q204 683 299 683Q376 683 387 683T401 677Q612 181 616 168L670 381Q723 592 723 606Q723 633 659 637Q635 637 635 648Q635 650 637 660Q641 676 643 679T653 683Q656 683 684 682T767 680Q817 680 843 681T873 682Q888 682 888 672Q888 650 880 642Q878 637 858 637Q787 633 769 597L620 7Q618 0 599 0Q585 0 582 2Q579 5 453 305L326 604L261 344Q196 88 196 79Q201 46 268 46H278Q284 41 284 38T282 19Q278 6 272 0H259Q228 2 151 2Q123 2 100 2T63 2T46 1Q31 1 31 10Q31 14 34 26T39 40Q41 46 62 46Q130 49 150 85Q154 91 221 362L289 634Q287 635 234 637Z"></path></g></g><g data-mml-node="mo" transform="translate(3452.9, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(4119.7, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mi" transform="translate(5175.5, 0)"><path data-c="50" d="M287 628Q287 635 230 637Q206 637 199 638T192 648Q192 649 194 659Q200 679 203 681T397 683Q587 682 600 680Q664 669 707 631T751 530Q751 453 685 389Q616 321 507 303Q500 302 402 301H307L277 182Q247 66 247 59Q247 55 248 54T255 50T272 48T305 46H336Q342 37 342 35Q342 19 335 5Q330 0 319 0Q316 0 282 1T182 2Q120 2 87 2T51 1Q33 1 33 11Q33 13 36 25Q40 41 44 43T67 46Q94 46 127 49Q141 52 146 61Q149 65 218 339T287 628ZM645 554Q645 567 643 575T634 597T609 619T560 635Q553 636 480 637Q463 637 445 637T416 636T404 636Q391 635 386 627Q384 621 367 550T332 412T314 344Q314 342 395 342H407H430Q542 342 590 392Q617 419 631 471T645 554Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 是有限的，任何落在该有限子空间之外的高频空间细节或高阶时间变化都无法被完整表示。这一分析揭示了固定分辨率视频建模的内在限制：即使使用复杂深度网络，只要输入和处理过程仍局限于固定网格，模型对连续运动轨迹和高频动态细节的表达能力仍然受到约束。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">三、理论基础：隐式神经场为何适合视频去噪？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">隐式神经表示（Implicit Neural Representation, INR）是一类以坐标为输入、以信号值或特征值为输出的连续函数建模方法。与传统显式网格表示不同，INR 不直接存储每个像素或体素的离散值，而是通过一个参数化神经网络 </span><span style="cursor:pointer;" data-formula="f_θ"><span data-formula="f_θ"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 1119.1 1023.2" aria-hidden="true" style="vertical-align: -0.72ex;width: 2.532ex;height: 2.315ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 建立坐标到信号的映射关系。在视频场景中，这一映射可以写为：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="f_θ:\mathrm{ℝ}^3(x,y,t)→\mathrm{ℝ}^3(r,g,b).
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -883.2 12152 1201.4" aria-hidden="true" style="max-width: 300%;vertical-align: -0.72ex;width: 27.493ex;height: 2.718ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(1396.9, 0)"><path data-c="3A" d="M78 370Q78 394 95 412T138 430Q162 430 180 414T199 371Q199 346 182 328T139 310T96 327T78 370ZM78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g><g data-mml-node="msup" transform="translate(1952.7, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="211D" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g></g><g data-mml-node="mn" transform="translate(722, 413) scale(0.707)"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path></g></g><g data-mml-node="mo" transform="translate(3078.2, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(3467.2, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(4039.2, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(4483.9, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(4973.9, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(5418.6, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(5779.6, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(6446.3, 0)"><path data-c="2192" d="M56 237T56 250T70 270H835Q719 357 692 493Q692 494 692 496T691 499Q691 511 708 511H711Q720 511 723 510T729 506T732 497T735 481T743 456Q765 389 816 336T935 261Q944 258 944 250Q944 244 939 241T915 231T877 212Q836 186 806 152T761 85T740 35T732 4Q730 -6 727 -8T711 -11Q691 -11 691 0Q691 7 696 25Q728 151 835 230H70Q56 237 56 250Z"></path></g><g data-mml-node="msup" transform="translate(7724.1, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="211D" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g></g><g data-mml-node="mn" transform="translate(722, 413) scale(0.707)"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path></g></g><g data-mml-node="mo" transform="translate(8849.7, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(9238.7, 0)"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(9689.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(10134.3, 0)"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g><g data-mml-node="mo" transform="translate(10611.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(11056, 0)"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g><g data-mml-node="mo" transform="translate(11485, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(11874, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">也就是说，给定任意空间坐标 </span><span style="cursor:pointer;" data-formula="(x,y)"><span data-formula="(x,y)"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2284.7 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 5.169ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(961, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1405.7, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1895.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 和时间坐标 </span><span style="cursor:pointer;" data-formula="t"><span data-formula="t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -626 361 637" aria-hidden="true" style="vertical-align: -0.025ex;width: 0.817ex;height: 1.441ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> ，模型都可以输出对应的 RGB 强度或潜在特征。与离散视频表示相比，这种隐式函数具有三个重要优势。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">第一，隐式神经场具有通用逼近能力。对于任意连续视频函数 </span><span style="cursor:pointer;" data-formula="V(x,y,t)"><span data-formula="V(x,y,t)"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 3859.3 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 8.732ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="56" d="M52 648Q52 670 65 683H76Q118 680 181 680Q299 680 320 683H330Q336 677 336 674T334 656Q329 641 325 637H304Q282 635 274 635Q245 630 242 620Q242 618 271 369T301 118L374 235Q447 352 520 471T595 594Q599 601 599 609Q599 633 555 637Q537 637 537 648Q537 649 539 661Q542 675 545 679T558 683Q560 683 570 683T604 682T668 681Q737 681 755 683H762Q769 676 769 672Q769 655 760 640Q757 637 743 637Q730 636 719 635T698 630T682 623T670 615T660 608T652 599T645 592L452 282Q272 -9 266 -16Q263 -18 259 -21L241 -22H234Q216 -22 216 -15Q213 -9 177 305Q139 623 138 626Q133 637 76 637H59Q52 642 52 648Z"></path></g><g data-mml-node="mo" transform="translate(769, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1158, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(1730, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(2174.7, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(2664.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(3109.3, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(3470.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></span></span><span leaf="">，只要网络具有足够的深度、宽度和非线性表达能力，就存在一组参数 </span><span style="cursor:pointer;" data-formula="θ"><span data-formula="θ"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 819 950" aria-hidden="true" style="vertical-align: -0.452ex;width: 1.853ex;height: 2.149ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g></g><g></g></svg></span></span><span leaf=""> ，使得：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\sup_{(x,y,t)∈\mathrm{Ω}}∥f_θ(x,y,t)−V(x,y,t)∥_2&lt;ε.
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 16612.6 1918.1" aria-hidden="true" style="max-width: 300%;vertical-align: -2.643ex;width: 37.585ex;height: 4.34ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="munder"><g data-mml-node="mo" transform="translate(712.8, 0)"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path><path data-c="75" d="M383 58Q327 -10 256 -10H249Q124 -10 105 89Q104 96 103 226Q102 335 102 348T96 369Q86 385 36 385H25V408Q25 431 27 431L38 432Q48 433 67 434T105 436Q122 437 142 438T172 441T184 442H187V261Q188 77 190 64Q193 49 204 40Q224 26 264 26Q290 26 311 35T343 58T363 90T375 120T379 144Q379 145 379 161T380 201T380 248V315Q380 361 370 372T320 385H302V431Q304 431 378 436T457 442H464V264Q464 84 465 81Q468 61 479 55T524 46H542V0Q540 0 467 -5T390 -11H383V58Z" transform="translate(394, 0)"></path><path data-c="70" d="M36 -148H50Q89 -148 97 -134V-126Q97 -119 97 -107T97 -77T98 -38T98 6T98 55T98 106Q98 140 98 177T98 243T98 296T97 335T97 351Q94 370 83 376T38 385H20V408Q20 431 22 431L32 432Q42 433 61 434T98 436Q115 437 135 438T165 441T176 442H179V416L180 390L188 397Q247 441 326 441Q407 441 464 377T522 216Q522 115 457 52T310 -11Q242 -11 190 33L182 40V-45V-101Q182 -128 184 -134T195 -145Q216 -148 244 -148H260V-194H252L228 -193Q205 -192 178 -192T140 -191Q37 -191 28 -194H20V-148H36ZM424 218Q424 292 390 347T305 402Q234 402 182 337V98Q222 26 294 26Q345 26 384 80T424 218Z" transform="translate(950, 0)"></path></g><g data-mml-node="TeXAtom" transform="translate(0, -891.3) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(961, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1239, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1729, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(2007, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(2368, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(2757, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3424, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="3A9" d="M55 454Q55 503 75 546T127 617T197 665T272 695T337 704H352Q396 704 404 703Q527 687 596 615T666 454Q666 392 635 330T559 200T499 83V80H543Q589 81 600 83T617 93Q622 102 629 135T636 172L637 177H677V175L660 89Q645 3 644 2V0H552H488Q461 0 456 3T451 20Q451 89 499 235T548 455Q548 512 530 555T483 622T424 656T361 668Q332 668 303 658T243 626T193 560T174 456Q174 380 222 233T270 20Q270 7 263 0H77V2Q76 3 61 89L44 175V177H84L85 172Q85 171 88 155T96 119T104 93Q109 86 120 84T178 80H222V83Q206 132 162 199T87 329T55 454Z"></path></g></g></g></g></g><g data-mml-node="mo" transform="translate(3209.4, 0)"><path data-c="2225" d="M133 736Q138 750 153 750Q164 750 170 739Q172 735 172 250T170 -239Q164 -250 152 -250Q144 -250 138 -244L137 -243Q133 -241 133 -179T132 250Q132 731 133 736ZM329 739Q334 750 346 750Q353 750 361 744L362 743Q366 741 366 679T367 250T367 -178T362 -243L361 -244Q355 -250 347 -250Q335 -250 329 -239Q327 -235 327 250T329 739Z"></path></g><g data-mml-node="msub" transform="translate(3987.2, 0)"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(5106.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(5495.3, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(6067.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(6512, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(7002, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(7446.7, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(7807.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(8418.9, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mi" transform="translate(9419.1, 0)"><path data-c="56" d="M52 648Q52 670 65 683H76Q118 680 181 680Q299 680 320 683H330Q336 677 336 674T334 656Q329 641 325 637H304Q282 635 274 635Q245 630 242 620Q242 618 271 369T301 118L374 235Q447 352 520 471T595 594Q599 601 599 609Q599 633 555 637Q537 637 537 648Q537 649 539 661Q542 675 545 679T558 683Q560 683 570 683T604 682T668 681Q737 681 755 683H762Q769 676 769 672Q769 655 760 640Q757 637 743 637Q730 636 719 635T698 630T682 623T670 615T660 608T652 599T645 592L452 282Q272 -9 266 -16Q263 -18 259 -21L241 -22H234Q216 -22 216 -15Q213 -9 177 305Q139 623 138 626Q133 637 76 637H59Q52 642 52 648Z"></path></g><g data-mml-node="mo" transform="translate(10188.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(10577.1, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(11149.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(11593.8, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(12083.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(12528.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(12889.5, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="msub" transform="translate(13556.2, 0)"><g data-mml-node="mo"><path data-c="2225" d="M133 736Q138 750 153 750Q164 750 170 739Q172 735 172 250T170 -239Q164 -250 152 -250Q144 -250 138 -244L137 -243Q133 -241 133 -179T132 250Q132 731 133 736ZM329 739Q334 750 346 750Q353 750 361 744L362 743Q366 741 366 679T367 250T367 -178T362 -243L361 -244Q355 -250 347 -250Q335 -250 329 -239Q327 -235 327 250T329 739Z"></path></g><g data-mml-node="mn" transform="translate(500, -150) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="mo" transform="translate(14459.8, 0)"><path data-c="3C" d="M694 -11T694 -19T688 -33T678 -40Q671 -40 524 29T234 166L90 235Q83 240 83 250Q83 261 91 266Q664 540 678 540Q681 540 687 534T694 519T687 505Q686 504 417 376L151 250L417 124Q686 -4 687 -5Q694 -11 694 -19Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(15515.6, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ε</tspan></text></g></g><g data-mml-node="mo" transform="translate(16334.6, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这意味着，隐式神经场理论上能够以任意精度逼近连续视频信号。在视频去噪中，这一性质使模型不再局限于固定分辨率输入，而是能够学习底层连续信号流形，并在离散噪声观测之外恢复更稳定的真实结构。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">第二，隐式神经场具有更强的高频表达潜力。传统神经网络，尤其是基于 ReLU 的 MLP，往往存在频谱偏置，即优先学习低频信号，而对高频纹理、细小边缘和快速运动变化拟合不足。为了增强高频表达能力，论文引入 Fourier Feature Embedding，将原始坐标映射到多频率正弦余弦空间：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="γ(\mathbf{p})=[\mathrm{sin}⁡(2π\mathbf{Bp}),\mathrm{cos}⁡(2π\mathbf{Bp})],\mathbf{p}=(x,y,t).
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 20029.8 1000" aria-hidden="true" style="max-width: 300%;vertical-align: -0.566ex;width: 45.316ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">γ</tspan></text></g></g><g data-mml-node="mo" transform="translate(819, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1208, 0)"><g data-mml-node="mi"><path data-c="70" d="M32 442L123 446Q214 450 215 450H221V409Q222 409 229 413T251 423T284 436T328 446T382 450Q480 450 540 388T600 223Q600 128 539 61T361 -6H354Q292 -6 236 28L227 34V-132H296V-194H287Q269 -191 163 -191Q56 -191 38 -194H29V-132H98V113V284Q98 330 97 348T93 370T83 376Q69 380 42 380H29V442H32ZM457 224Q457 303 427 349T350 395Q282 395 235 352L227 345V104L233 97Q274 45 337 45Q383 45 420 86T457 224Z"></path></g></g><g data-mml-node="mo" transform="translate(1847, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(2513.8, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(3569.6, 0)"><path data-c="5B" d="M118 -250V750H255V710H158V-210H255V-250H118Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3847.6, 0)"><g data-mml-node="mi"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path></g><g data-mml-node="mi" transform="translate(394, 0)"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path></g><g data-mml-node="mi" transform="translate(672, 0)"><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(5075.6, 0)"><g data-mml-node="mo"><path data-c="2061" d=""></path></g></g><g data-mml-node="mo" transform="translate(5075.6, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mn" transform="translate(5464.6, 0)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(5964.6, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">π</tspan></text></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(6783.6, 0)"><g data-mml-node="mi"><path data-c="42" d="M720 510Q720 476 704 448T665 404T619 377T580 362L564 359L583 356Q602 353 632 342T690 312Q712 292 725 276Q752 235 752 189V183Q752 160 741 125Q698 18 547 2Q543 1 288 0H39V62H147V624H39V686H264H409Q502 686 542 681T624 655Q720 607 720 510ZM563 513Q563 553 548 578T518 611T486 622Q479 624 385 624H293V382H375Q458 383 467 385Q563 405 563 513ZM590 192Q590 307 505 329Q504 330 503 330L398 331H293V62H391H400H444Q496 62 528 75T580 131Q590 155 590 192Z"></path></g><g data-mml-node="mi" transform="translate(818, 0)"><path data-c="70" d="M32 442L123 446Q214 450 215 450H221V409Q222 409 229 413T251 423T284 436T328 446T382 450Q480 450 540 388T600 223Q600 128 539 61T361 -6H354Q292 -6 236 28L227 34V-132H296V-194H287Q269 -191 163 -191Q56 -191 38 -194H29V-132H98V113V284Q98 330 97 348T93 370T83 376Q69 380 42 380H29V442H32ZM457 224Q457 303 427 349T350 395Q282 395 235 352L227 345V104L233 97Q274 45 337 45Q383 45 420 86T457 224Z"></path></g></g><g data-mml-node="mo" transform="translate(8240.6, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(8629.6, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(9074.2, 0)"><g data-mml-node="mi"><path data-c="63" d="M370 305T349 305T313 320T297 358Q297 381 312 396Q317 401 317 402T307 404Q281 408 258 408Q209 408 178 376Q131 329 131 219Q131 137 162 90Q203 29 272 29Q313 29 338 55T374 117Q376 125 379 127T395 129H409Q415 123 415 120Q415 116 411 104T395 71T366 33T318 2T249 -11Q163 -11 99 53T34 214Q34 318 99 383T250 448T370 421T404 357Q404 334 387 320Z"></path></g><g data-mml-node="mi" transform="translate(444, 0)"><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z"></path></g><g data-mml-node="mi" transform="translate(944, 0)"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(10412.2, 0)"><g data-mml-node="mo"><path data-c="2061" d=""></path></g></g><g data-mml-node="mo" transform="translate(10412.2, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mn" transform="translate(10801.2, 0)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(11301.2, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">π</tspan></text></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(12120.2, 0)"><g data-mml-node="mi"><path data-c="42" d="M720 510Q720 476 704 448T665 404T619 377T580 362L564 359L583 356Q602 353 632 342T690 312Q712 292 725 276Q752 235 752 189V183Q752 160 741 125Q698 18 547 2Q543 1 288 0H39V62H147V624H39V686H264H409Q502 686 542 681T624 655Q720 607 720 510ZM563 513Q563 553 548 578T518 611T486 622Q479 624 385 624H293V382H375Q458 383 467 385Q563 405 563 513ZM590 192Q590 307 505 329Q504 330 503 330L398 331H293V62H391H400H444Q496 62 528 75T580 131Q590 155 590 192Z"></path></g><g data-mml-node="mi" transform="translate(818, 0)"><path data-c="70" d="M32 442L123 446Q214 450 215 450H221V409Q222 409 229 413T251 423T284 436T328 446T382 450Q480 450 540 388T600 223Q600 128 539 61T361 -6H354Q292 -6 236 28L227 34V-132H296V-194H287Q269 -191 163 -191Q56 -191 38 -194H29V-132H98V113V284Q98 330 97 348T93 370T83 376Q69 380 42 380H29V442H32ZM457 224Q457 303 427 349T350 395Q282 395 235 352L227 345V104L233 97Q274 45 337 45Q383 45 420 86T457 224Z"></path></g></g><g data-mml-node="mo" transform="translate(13577.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(13966.2, 0)"><path data-c="5D" d="M22 710V750H159V-250H22V-210H119V710H22Z"></path></g><g data-mml-node="mo" transform="translate(14244.2, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(14688.9, 0)"><g data-mml-node="mi"><path data-c="70" d="M32 442L123 446Q214 450 215 450H221V409Q222 409 229 413T251 423T284 436T328 446T382 450Q480 450 540 388T600 223Q600 128 539 61T361 -6H354Q292 -6 236 28L227 34V-132H296V-194H287Q269 -191 163 -191Q56 -191 38 -194H29V-132H98V113V284Q98 330 97 348T93 370T83 376Q69 380 42 380H29V442H32ZM457 224Q457 303 427 349T350 395Q282 395 235 352L227 345V104L233 97Q274 45 337 45Q383 45 420 86T457 224Z"></path></g></g><g data-mml-node="mo" transform="translate(15605.7, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(16661.4, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(17050.4, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(17622.4, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(18067.1, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(18557.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(19001.8, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(19362.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(19751.8, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">通过这一映射，低维坐标被投影到包含多尺度频率信息的高维空间，使隐式神经场能够更有效地表示边缘、纹理和细粒度运动变化。这对于视频去噪尤其重要，因为真实信号中的高频结构往往与噪声混杂在一起，模型需要既抑制随机噪声，又保留真实细节。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">第三，隐式神经场是连续可微的，这为时空动态建模提供了新的可能。传统光流方法需要显式估计帧间像素位移，而隐式神经场可以通过函数导数直接刻画连续运动变化。例如，时间导数：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\frac{∂f_θ}{∂t}(x,y,t)
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1493.2 5215.5 2201.2" aria-hidden="true" style="max-width: 300%;vertical-align: -1.602ex;width: 11.8ex;height: 4.98ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mfrac"><g data-mml-node="mrow" transform="translate(220, 778.2)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g></g><g data-mml-node="msub" transform="translate(566, 0)"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g></g><g data-mml-node="mrow" transform="translate(599.1, -686)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g></g><g data-mml-node="mi" transform="translate(566, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><rect width="1885.1" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(2125.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(2514.1, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(3086.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(3530.8, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(4020.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(4465.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(4826.5, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">可以被理解为局部像素强度随时间变化的速度项，而二阶时间导数：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\frac{∂^2 f_θ}{∂t^2}(x,y,t)
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1691.1 5676 2507.1" aria-hidden="true" style="max-width: 300%;vertical-align: -1.846ex;width: 12.842ex;height: 5.672ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mfrac"><g data-mml-node="mrow" transform="translate(220, 778.2)"><g data-mml-node="msup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g></g><g data-mml-node="mn" transform="translate(623, 442.1) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="msub" transform="translate(1026.6, 0)"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g></g><g data-mml-node="mrow" transform="translate(627.6, -793.9)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g></g><g data-mml-node="msup" transform="translate(566, 0)"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mn" transform="translate(361, 363) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g></g><rect width="2345.7" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(2585.7, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(2974.7, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(3546.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(3991.3, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(4481.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(4926, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(5287, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">可以反映运动加速度或动态变化率。空间梯度：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathrm{∇}_{x,y} f_θ(x,y,t)=(\frac{∂f_θ}{∂x},\frac{∂f_θ}{∂y})
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1493.2 12846.4 2384.2" aria-hidden="true" style="max-width: 300%;vertical-align: -2.016ex;width: 29.064ex;height: 5.394ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2207" d="M46 676Q46 679 51 683H781Q786 679 786 676Q786 674 617 326T444 -26Q439 -33 416 -33T388 -26Q385 -22 216 326T46 676ZM697 596Q697 597 445 597T193 596Q195 591 319 336T445 80L697 596Z"></path></g></g></g><g data-mml-node="TeXAtom" transform="translate(833, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(572, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(850, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g></g><g data-mml-node="msub" transform="translate(1830.5, 0)"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(2949.6, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(3338.6, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(3910.6, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(4355.3, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(4845.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(5290, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(5651, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(6317.8, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(7373.5, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mfrac" transform="translate(7762.5, 0)"><g data-mml-node="mrow" transform="translate(220, 778.2)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g></g><g data-mml-node="msub" transform="translate(566, 0)"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g></g><g data-mml-node="mrow" transform="translate(493.6, -686)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g></g><g data-mml-node="mi" transform="translate(566, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g></g><rect width="1885.1" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(9887.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mfrac" transform="translate(10332.3, 0)"><g data-mml-node="mrow" transform="translate(220, 778.2)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g></g><g data-mml-node="msub" transform="translate(566, 0)"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g></g><g data-mml-node="mrow" transform="translate(534.6, -686)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g></g><g data-mml-node="mi" transform="translate(566, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g><rect width="1885.1" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(12457.4, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">则可以用于描述纹理边缘和局部结构变化。在平滑运动假设下，像素强度在两个时间点之间的演化可以通过积分形式近似：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="f_θ(x,y,t_2)≈f_θ(x,y,t_1)+\int\nolimits^{t_2}_{t_1}{}\frac{∂f_θ}{∂t}(x,y,τ)dτ.
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1530.7 20901.4 2533.1" aria-hidden="true" style="max-width: 300%;vertical-align: -2.268ex;width: 47.288ex;height: 5.731ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(1119.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1508.1, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(2080.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(2524.8, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(3014.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(3459.5, 0)"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mn" transform="translate(361, -150) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="mo" transform="translate(4224, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(4890.8, 0)"><path data-c="2248" d="M55 319Q55 360 72 393T114 444T163 472T205 482Q207 482 213 482T223 483Q262 483 296 468T393 413L443 381Q502 346 553 346Q609 346 649 375T694 454Q694 465 698 474T708 483Q722 483 722 452Q722 386 675 338T555 289Q514 289 468 310T388 357T308 404T224 426Q164 426 125 393T83 318Q81 289 69 289Q55 289 55 319ZM55 85Q55 126 72 159T114 210T163 238T205 248Q207 248 213 248T223 249Q262 249 296 234T393 179L443 147Q502 112 553 112Q609 112 649 141T694 220Q694 249 708 249T722 217Q722 153 675 104T555 55Q514 55 468 76T388 123T308 170T224 192Q164 192 125 159T83 84Q80 55 69 55Q55 55 55 85Z"></path></g><g data-mml-node="msub" transform="translate(5946.6, 0)"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(7065.7, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(7454.7, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(8026.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(8471.3, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(8961.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(9406, 0)"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mn" transform="translate(361, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="mo" transform="translate(10170.6, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(10781.8, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="msubsup" transform="translate(11782, 0)"><g data-mml-node="mo"><path data-c="222B" d="M114 -798Q132 -824 165 -824H167Q195 -824 223 -764T275 -600T320 -391T362 -164Q365 -143 367 -133Q439 292 523 655T645 1127Q651 1145 655 1157T672 1201T699 1257T733 1306T777 1346T828 1360Q884 1360 912 1325T944 1245Q944 1220 932 1205T909 1186T887 1183Q866 1183 849 1198T832 1239Q832 1287 885 1296L882 1300Q879 1303 874 1307T866 1313Q851 1323 833 1323Q819 1323 807 1311T775 1255T736 1139T689 936T633 628Q574 293 510 -5T410 -437T355 -629Q278 -862 165 -862Q125 -862 92 -831T55 -746Q55 -711 74 -698T112 -685Q133 -685 150 -700T167 -741Q167 -789 114 -798Z"></path></g><g data-mml-node="TeXAtom" transform="translate(1071.6, 1088.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mn" transform="translate(361, -150) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g></g><g data-mml-node="TeXAtom" transform="translate(556, -896.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mn" transform="translate(361, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(13610.9, 0)"></g><g data-mml-node="mfrac" transform="translate(13610.9, 0)"><g data-mml-node="mrow" transform="translate(220, 778.2)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g></g><g data-mml-node="msub" transform="translate(566, 0)"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g></g><g data-mml-node="mrow" transform="translate(599.1, -686)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g></g><g data-mml-node="mi" transform="translate(566, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><rect width="1885.1" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(15736, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(16125, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(16697, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(17141.7, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(17631.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(18076.4, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g><g data-mml-node="mo" transform="translate(18895.4, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mi" transform="translate(19284.4, 0)"><path data-c="64" d="M366 683Q367 683 438 688T511 694Q523 694 523 686Q523 679 450 384T375 83T374 68Q374 26 402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487H491Q506 153 506 145Q506 140 503 129Q490 79 473 48T445 8T417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157Q33 205 53 255T101 341Q148 398 195 420T280 442Q336 442 364 400Q369 394 369 396Q370 400 396 505T424 616Q424 629 417 632T378 637H357Q351 643 351 645T353 664Q358 683 366 683ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(19804.4, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g><g data-mml-node="mo" transform="translate(20623.4, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这一公式表明，连续隐式函数不仅能够拟合单个时间点的图像内容，还能够在函数空间中表达时间轨迹，从而为跨帧一致性建模提供了更自然的数学形式。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="不同激活函数对比" class="rich_pages wxw-img" data-ratio="0.5888888888888889" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175727" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=6599d1b4&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicfotO4qGSQHibqU8RWOC8WFRQiboH4iaOIZibAk3shObKWf3AxgzuKrVNdhLFlWhaHvq3UjaKiaMaiajmKQ39TRPOPakpkoQBN85nO8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">不同激活函数对比</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了进一步增强连续时空建模能力，论文采用 SIREN 形式的周期激活函数。其隐藏层形式为：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{h}_i=\mathrm{sin}⁡(ω_0\mathbf{W}_i\mathbf{h}_{i−1}+\mathbf{b}_i),
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 11248 1000.9" aria-hidden="true" style="max-width: 300%;vertical-align: -0.568ex;width: 25.448ex;height: 2.265ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="68" d="M40 686L131 690Q222 694 223 694H229V533L230 372L238 381Q248 394 264 407T317 435T398 450Q428 450 448 447T491 434T529 402T551 346Q553 335 554 198V62H623V0H614Q596 3 489 3Q374 3 365 0H356V62H425V194V275Q425 348 416 373T371 399Q326 399 288 370T238 290Q236 281 235 171V62H304V0H295Q277 3 171 3Q64 3 46 0H37V62H106V332Q106 387 106 453T107 534Q107 593 105 605T91 620Q77 624 50 624H37V686H40Z"></path></g></g><g data-mml-node="mi" transform="translate(639, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(1210.7, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(2266.5, 0)"><g data-mml-node="mi"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path></g><g data-mml-node="mi" transform="translate(394, 0)"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path></g><g data-mml-node="mi" transform="translate(672, 0)"><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3494.5, 0)"><g data-mml-node="mo"><path data-c="2061" d=""></path></g></g><g data-mml-node="mo" transform="translate(3494.5, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(3883.5, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ω</tspan></text></g></g><g data-mml-node="mn" transform="translate(819, -235.4) scale(0.707)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g><g data-mml-node="msub" transform="translate(5106.1, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="57" d="M915 686L1052 683Q1142 683 1157 686H1164V624H1073L957 320Q930 249 900 170T855 52T839 10Q834 0 826 -5Q821 -7 799 -7H792Q777 -7 772 -5T759 10Q759 11 748 39T716 122T676 228L594 442L512 228Q486 159 455 78Q433 19 428 9T416 -5Q411 -7 389 -7H379Q356 -7 349 10Q349 12 334 51T288 170T231 320L116 624H24V686H35Q44 683 183 683Q331 683 355 686H368V624H323Q278 624 278 623L437 207L499 369L561 531L526 624H434V686H445Q454 683 593 683Q741 683 765 686H778V624H733Q688 624 688 623L847 207Q848 207 927 415T1006 624H905V686H915Z"></path></g></g><g data-mml-node="mi" transform="translate(1189, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="msub" transform="translate(6589, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="68" d="M40 686L131 690Q222 694 223 694H229V533L230 372L238 381Q248 394 264 407T317 435T398 450Q428 450 448 447T491 434T529 402T551 346Q553 335 554 198V62H623V0H614Q596 3 489 3Q374 3 365 0H356V62H425V194V275Q425 348 416 373T371 399Q326 399 288 370T238 290Q236 281 235 171V62H304V0H295Q277 3 171 3Q64 3 46 0H37V62H106V332Q106 387 106 453T107 534Q107 593 105 605T91 620Q77 624 50 624H37V686H40Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(639, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(1123, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g><g data-mml-node="mo" transform="translate(8647.9, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="msub" transform="translate(9648.1, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="62" d="M32 686L123 690Q214 694 215 694H221V409Q289 450 378 450Q479 450 539 387T600 221Q600 122 535 58T358 -6H355Q272 -6 203 53L160 1L129 0H98V301Q98 362 98 435T99 525Q99 591 97 604T83 620Q69 624 42 624H29V686H32ZM227 105L232 99Q237 93 242 87T258 73T280 59T306 49T339 45Q380 45 411 66T451 131Q457 160 457 230Q457 264 456 284T448 329T430 367T396 389T343 398Q282 398 235 355L227 348V105Z"></path></g></g><g data-mml-node="mi" transform="translate(639, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(10581, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(10970, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中 </span><span style="cursor:pointer;" data-formula="ω_0"><span data-formula="ω_0"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 1222.6 1000.9" aria-hidden="true" style="vertical-align: -0.568ex;width: 2.766ex;height: 2.265ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ω</tspan></text></g></g><g data-mml-node="mn" transform="translate(819, -235.4) scale(0.707)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 控制频率范围， </span><span style="cursor:pointer;" data-formula="\mathbf{W}_i"><span data-formula="\mathbf{W}_i"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -686 1483 843.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 3.355ex;height: 1.909ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="57" d="M915 686L1052 683Q1142 683 1157 686H1164V624H1073L957 320Q930 249 900 170T855 52T839 10Q834 0 826 -5Q821 -7 799 -7H792Q777 -7 772 -5T759 10Q759 11 748 39T716 122T676 228L594 442L512 228Q486 159 455 78Q433 19 428 9T416 -5Q411 -7 389 -7H379Q356 -7 349 10Q349 12 334 51T288 170T231 320L116 624H24V686H35Q44 683 183 683Q331 683 355 686H368V624H323Q278 624 278 623L437 207L499 369L561 531L526 624H434V686H445Q454 683 593 683Q741 683 765 686H778V624H733Q688 624 688 623L847 207Q848 207 927 415T1006 624H905V686H915Z"></path></g></g><g data-mml-node="mi" transform="translate(1189, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 和 </span><span style="cursor:pointer;" data-formula="\mathbf{b}_i"><span data-formula="\mathbf{b}_i"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -694 933 851.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 2.111ex;height: 1.927ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="62" d="M32 686L123 690Q214 694 215 694H221V409Q289 450 378 450Q479 450 539 387T600 221Q600 122 535 58T358 -6H355Q272 -6 203 53L160 1L129 0H98V301Q98 362 98 435T99 525Q99 591 97 604T83 620Q69 624 42 624H29V686H32ZM227 105L232 99Q237 93 242 87T258 73T280 59T306 49T339 45Q380 45 411 66T451 131Q457 160 457 230Q457 264 456 284T448 329T430 367T396 389T343 398Q282 398 235 355L227 348V105Z"></path></g></g><g data-mml-node="mi" transform="translate(639, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 为可学习参数。论文通过频率响应和二阶导数平滑性对 ReLU、Tanh、Sigmoid 与 SIREN 进行了比较，指出 SIREN 在高频响应方面更强，同时具备更加稳定的高阶导数，因此更适合捕捉快速变化的时间动态和细粒度空间结构。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">四、方法概述：SINF 的整体框架</span></span></h2><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="SINF整体框架示意图" class="rich_pages wxw-img" data-ratio="0.47685185185185186" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175729" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=dac9d7d1&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8m5qPyDm0icWIuGMwJ2NtCZnLqwVOxDrkR4ZibDYFnNWDeUkSTUJnvQ9LWe1G91VBvYw0Aqk3dVAGy5znmwrLrUoKgMSjwKqXWY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">SINF整体框架示意图</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">基于上述理论分析，论文提出了面向无监督视频去噪的连续时空隐式神经场 SINF。给定一个噪声视频序列：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathcal{V=\{} I_t\}^T_{t=1},I_t∈\mathrm{ℝ}^{H×W×3},
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -896 11220 1200.9" aria-hidden="true" style="max-width: 300%;vertical-align: -0.69ex;width: 25.385ex;height: 2.717ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="56" d="M25 633Q25 647 47 665T100 683Q291 683 291 306Q291 264 288 213T282 132L279 102Q281 102 308 126T378 191T464 279T545 381T596 479Q600 490 600 502Q600 527 581 550T523 577Q505 577 505 601Q505 622 516 647T542 681Q546 683 558 683Q605 679 631 645T658 559Q658 423 487 215Q409 126 308 37T190 -52Q177 -52 177 -28Q177 -26 183 15T196 127T203 270Q203 356 192 421T165 523T126 583T83 613T41 620Q25 620 25 633Z"></path></g><g data-mml-node="mo" transform="translate(935.8, 0)"><path data-c="3D" d="M776 357T776 347T761 327H470Q180 327 176 329Q164 334 164 347Q164 359 176 365Q179 367 470 367H761Q776 357 776 347ZM116 143T116 153T131 173H422Q713 173 717 171Q728 166 728 153T717 135Q713 133 422 133H131Q116 143 116 153Z"></path></g><g data-mml-node="mo" transform="translate(1980.6, 0)"><path data-c="7B" d="M434 -231Q434 -244 428 -250H410Q281 -250 230 -184Q225 -177 222 -172T217 -161T213 -148T211 -133T210 -111T209 -84T209 -47T209 0Q209 21 209 53Q208 142 204 153Q203 154 203 155Q189 191 153 211T82 231Q71 231 68 234T65 250T68 266T82 269Q116 269 152 289T203 345Q208 356 208 377T209 529V579Q209 634 215 656T244 698Q270 724 324 740Q361 748 377 749Q379 749 390 749T408 750H428Q434 744 434 732Q434 719 431 716Q429 713 415 713Q362 710 332 689T296 647Q291 634 291 499V417Q291 370 288 353T271 314Q240 271 184 255L170 250L184 245Q202 239 220 230T262 196T290 137Q291 131 291 1Q291 -134 296 -147Q306 -174 339 -192T415 -213Q429 -213 431 -216Q434 -219 434 -231Z"></path></g></g><g data-mml-node="msub" transform="translate(2480.6, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="mi" transform="translate(440, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="msubsup" transform="translate(3225.8, 0)"><g data-mml-node="mo"><path data-c="7D" d="M65 731Q65 745 68 747T88 750Q171 750 216 725T279 670Q288 649 289 635T291 501Q292 362 293 357Q306 312 345 291T417 269Q428 269 431 266T434 250T431 234T417 231Q380 231 345 210T298 157Q293 143 292 121T291 -28V-79Q291 -134 285 -156T256 -198Q202 -250 89 -250Q71 -250 68 -247T65 -230Q65 -224 65 -223T66 -218T69 -214T77 -213Q91 -213 108 -210T146 -200T183 -177T207 -139Q208 -134 209 3L210 139Q223 196 280 230Q315 247 330 250Q305 257 280 270Q225 304 212 352L210 362L209 498Q208 635 207 640Q195 680 154 696T77 713Q68 713 67 716T65 731Z"></path></g><g data-mml-node="mi" transform="translate(500, 413) scale(0.707)"><path data-c="54" d="M40 437Q21 437 21 445Q21 450 37 501T71 602L88 651Q93 669 101 677H569H659Q691 677 697 676T704 667Q704 661 687 553T668 444Q668 437 649 437Q640 437 637 437T631 442L629 445Q629 451 635 490T641 551Q641 586 628 604T573 629Q568 630 515 631Q469 631 457 630T439 622Q438 621 368 343T298 60Q298 48 386 46Q418 46 427 45T436 36Q436 31 433 22Q429 4 424 1L422 0Q419 0 415 0Q410 0 363 1T228 2Q99 2 64 0H49Q43 6 43 9T45 27Q49 40 55 46H83H94Q174 46 189 55Q190 56 191 56Q196 59 201 76T241 233Q258 301 269 344Q339 619 339 625Q339 630 310 630H279Q212 630 191 624Q146 614 121 583T67 467Q60 445 57 441T43 437H40Z"></path></g><g data-mml-node="TeXAtom" transform="translate(500, -247) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(1139, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g><g data-mml-node="mo" transform="translate(4934.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(5379.4, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="mi" transform="translate(440, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(6402.5, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="msup" transform="translate(7347.3, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="211D" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g></g><g data-mml-node="TeXAtom" transform="translate(722, 413) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="48" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 219 683Q260 681 355 681Q389 681 418 681T463 682T483 682Q499 682 499 672Q499 670 497 658Q492 641 487 638H485Q483 638 480 638T473 638T464 637T455 637Q416 636 405 634T387 623Q384 619 355 500Q348 474 340 442T328 395L324 380Q324 378 469 378H614L615 381Q615 384 646 504Q674 619 674 627T617 637Q594 637 587 639T580 648Q580 650 582 660Q586 677 588 679T604 682Q609 682 646 681T740 680Q802 680 835 681T871 682Q888 682 888 672Q888 645 876 638H874Q872 638 869 638T862 638T853 637T844 637Q805 636 794 634T776 623Q773 618 704 340T634 58Q634 51 638 51Q646 48 692 46H723Q729 38 729 37T726 19Q722 6 716 0H701Q664 2 567 2Q533 2 504 2T458 2T437 1Q420 1 420 10Q420 15 423 24Q428 43 433 45Q437 46 448 46H454Q481 46 514 49Q520 50 522 50T528 55T534 64T540 82T547 110T558 153Q565 181 569 198Q602 330 602 331T457 332H312L279 197Q245 63 245 58Q245 51 253 49T303 46H334Q340 38 340 37T337 19Q333 6 327 0H312Q275 2 178 2Q144 2 115 2T69 2T48 1Q31 1 31 10Q31 12 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mo" transform="translate(888, 0)"><path data-c="D7" d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path></g><g data-mml-node="mi" transform="translate(1666, 0)"><path data-c="57" d="M436 683Q450 683 486 682T553 680Q604 680 638 681T677 682Q695 682 695 674Q695 670 692 659Q687 641 683 639T661 637Q636 636 621 632T600 624T597 615Q597 603 613 377T629 138L631 141Q633 144 637 151T649 170T666 200T690 241T720 295T759 362Q863 546 877 572T892 604Q892 619 873 628T831 637Q817 637 817 647Q817 650 819 660Q823 676 825 679T839 682Q842 682 856 682T895 682T949 681Q1015 681 1034 683Q1048 683 1048 672Q1048 666 1045 655T1038 640T1028 637Q1006 637 988 631T958 617T939 600T927 584L923 578L754 282Q586 -14 585 -15Q579 -22 561 -22Q546 -22 542 -17Q539 -14 523 229T506 480L494 462Q472 425 366 239Q222 -13 220 -15T215 -19Q210 -22 197 -22Q178 -22 176 -15Q176 -12 154 304T131 622Q129 631 121 633T82 637H58Q51 644 51 648Q52 671 64 683H76Q118 680 176 680Q301 680 313 683H323Q329 677 329 674T327 656Q322 641 318 637H297Q236 634 232 620Q262 160 266 136L501 550L499 587Q496 629 489 632Q483 636 447 637Q428 637 422 639T416 648Q416 650 418 660Q419 664 420 669T421 676T424 680T428 682T436 683Z"></path></g><g data-mml-node="mo" transform="translate(2714, 0)"><path data-c="D7" d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path></g><g data-mml-node="mn" transform="translate(3492, 0)"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path></g></g></g><g data-mml-node="mo" transform="translate(10942, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">每一帧可表示为未知干净帧 </span><span style="cursor:pointer;" data-formula="C_t"><span data-formula="C_t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 1020.3 862.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 2.308ex;height: 1.952ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="mi" transform="translate(715, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 与噪声项 </span><span style="cursor:pointer;" data-formula="ϵ_t"><span data-formula="ϵ_t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 643.3 993.1" aria-hidden="true" style="vertical-align: -0.55ex;width: 1.455ex;height: 2.247ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϵ</tspan></text></g></g><g data-mml-node="mi" transform="translate(338, -235.4) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 的叠加：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="I_t(\mathbf{s})=C_t(\mathbf{s})+ϵ_t(\mathbf{s}),\mathbf{s}=(x,y)∈\mathrm{Ω}.
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 15400.2 1000" aria-hidden="true" style="max-width: 300%;vertical-align: -0.566ex;width: 34.842ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="mi" transform="translate(440, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(745.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1134.3, 0)"><g data-mml-node="mi"><path data-c="73" d="M38 315Q38 339 45 360T70 404T127 440T223 453Q273 453 320 436L338 445L357 453H366Q380 453 383 447T386 403V387V355Q386 331 383 326T365 321H355H349Q333 321 329 324T324 341Q317 406 224 406H216Q123 406 123 353Q123 334 143 321T188 304T244 294T285 286Q305 281 325 273T373 237T412 172Q414 162 414 142Q414 -6 230 -6Q154 -6 117 22L68 -6H58Q44 -6 41 0T38 42V73Q38 85 38 101T37 122Q37 144 42 148T68 153H75Q87 153 91 151T97 147T103 132Q131 46 220 46H230Q257 46 265 47Q330 58 330 108Q330 127 316 142Q300 156 284 162Q271 168 212 178T122 202Q38 243 38 315Z"></path></g></g><g data-mml-node="mo" transform="translate(1588.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(2255, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msub" transform="translate(3310.8, 0)"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="mi" transform="translate(715, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(4331.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(4720.1, 0)"><g data-mml-node="mi"><path data-c="73" d="M38 315Q38 339 45 360T70 404T127 440T223 453Q273 453 320 436L338 445L357 453H366Q380 453 383 447T386 403V387V355Q386 331 383 326T365 321H355H349Q333 321 329 324T324 341Q317 406 224 406H216Q123 406 123 353Q123 334 143 321T188 304T244 294T285 286Q305 281 325 273T373 237T412 172Q414 162 414 142Q414 -6 230 -6Q154 -6 117 22L68 -6H58Q44 -6 41 0T38 42V73Q38 85 38 101T37 122Q37 144 42 148T68 153H75Q87 153 91 151T97 147T103 132Q131 46 220 46H230Q257 46 265 47Q330 58 330 108Q330 127 316 142Q300 156 284 162Q271 168 212 178T122 202Q38 243 38 315Z"></path></g></g><g data-mml-node="mo" transform="translate(5174.1, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(5785.3, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="msub" transform="translate(6785.5, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϵ</tspan></text></g></g><g data-mml-node="mi" transform="translate(338, -235.4) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(7428.8, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(7817.8, 0)"><g data-mml-node="mi"><path data-c="73" d="M38 315Q38 339 45 360T70 404T127 440T223 453Q273 453 320 436L338 445L357 453H366Q380 453 383 447T386 403V387V355Q386 331 383 326T365 321H355H349Q333 321 329 324T324 341Q317 406 224 406H216Q123 406 123 353Q123 334 143 321T188 304T244 294T285 286Q305 281 325 273T373 237T412 172Q414 162 414 142Q414 -6 230 -6Q154 -6 117 22L68 -6H58Q44 -6 41 0T38 42V73Q38 85 38 101T37 122Q37 144 42 148T68 153H75Q87 153 91 151T97 147T103 132Q131 46 220 46H230Q257 46 265 47Q330 58 330 108Q330 127 316 142Q300 156 284 162Q271 168 212 178T122 202Q38 243 38 315Z"></path></g></g><g data-mml-node="mo" transform="translate(8271.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(8660.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(9105.5, 0)"><g data-mml-node="mi"><path data-c="73" d="M38 315Q38 339 45 360T70 404T127 440T223 453Q273 453 320 436L338 445L357 453H366Q380 453 383 447T386 403V387V355Q386 331 383 326T365 321H355H349Q333 321 329 324T324 341Q317 406 224 406H216Q123 406 123 353Q123 334 143 321T188 304T244 294T285 286Q305 281 325 273T373 237T412 172Q414 162 414 142Q414 -6 230 -6Q154 -6 117 22L68 -6H58Q44 -6 41 0T38 42V73Q38 85 38 101T37 122Q37 144 42 148T68 153H75Q87 153 91 151T97 147T103 132Q131 46 220 46H230Q257 46 265 47Q330 58 330 108Q330 127 316 142Q300 156 284 162Q271 168 212 178T122 202Q38 243 38 315Z"></path></g></g><g data-mml-node="mo" transform="translate(9837.2, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(10893, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(11282, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(11854, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(12298.7, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(12788.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(13455.5, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(14400.2, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="3A9" d="M55 454Q55 503 75 546T127 617T197 665T272 695T337 704H352Q396 704 404 703Q527 687 596 615T666 454Q666 392 635 330T559 200T499 83V80H543Q589 81 600 83T617 93Q622 102 629 135T636 172L637 177H677V175L660 89Q645 3 644 2V0H552H488Q461 0 456 3T451 20Q451 89 499 235T548 455Q548 512 530 555T483 622T424 656T361 668Q332 668 303 658T243 626T193 560T174 456Q174 380 222 233T270 20Q270 7 263 0H77V2Q76 3 61 89L44 175V177H84L85 172Q85 171 88 155T96 119T104 93Q109 86 120 84T178 80H222V83Q206 132 162 199T87 329T55 454Z"></path></g></g></g><g data-mml-node="mo" transform="translate(15122.2, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中， </span><span style="cursor:pointer;" data-formula="ϵ_t"><span data-formula="ϵ_t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 643.3 993.1" aria-hidden="true" style="vertical-align: -0.55ex;width: 1.455ex;height: 2.247ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϵ</tspan></text></g></g><g data-mml-node="mi" transform="translate(338, -235.4) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 可以是非独立同分布、异方差甚至具有真实成像相关性的复杂噪声。SINF 的目标是在没有干净标签的情况下，仅依赖噪声视频 </span><span style="cursor:pointer;" data-formula="\{I_t\}"><span data-formula="\{I_t\}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 1745.3 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 3.949ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="7B" d="M434 -231Q434 -244 428 -250H410Q281 -250 230 -184Q225 -177 222 -172T217 -161T213 -148T211 -133T210 -111T209 -84T209 -47T209 0Q209 21 209 53Q208 142 204 153Q203 154 203 155Q189 191 153 211T82 231Q71 231 68 234T65 250T68 266T82 269Q116 269 152 289T203 345Q208 356 208 377T209 529V579Q209 634 215 656T244 698Q270 724 324 740Q361 748 377 749Q379 749 390 749T408 750H428Q434 744 434 732Q434 719 431 716Q429 713 415 713Q362 710 332 689T296 647Q291 634 291 499V417Q291 370 288 353T271 314Q240 271 184 255L170 250L184 245Q202 239 220 230T262 196T290 137Q291 131 291 1Q291 -134 296 -147Q306 -174 339 -192T415 -213Q429 -213 431 -216Q434 -219 434 -231Z"></path></g><g data-mml-node="msub" transform="translate(500, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="mi" transform="translate(440, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1245.3, 0)"><path data-c="7D" d="M65 731Q65 745 68 747T88 750Q171 750 216 725T279 670Q288 649 289 635T291 501Q292 362 293 357Q306 312 345 291T417 269Q428 269 431 266T434 250T431 234T417 231Q380 231 345 210T298 157Q293 143 292 121T291 -28V-79Q291 -134 285 -156T256 -198Q202 -250 89 -250Q71 -250 68 -247T65 -230Q65 -224 65 -223T66 -218T69 -214T77 -213Q91 -213 108 -210T146 -200T183 -177T207 -139Q208 -134 209 3L210 139Q223 196 280 230Q315 247 330 250Q305 257 280 270Q225 304 212 352L210 362L209 498Q208 635 207 640Q195 680 154 696T77 713Q68 713 67 716T65 731Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 恢复干净视频 </span><span style="cursor:pointer;" data-formula="\{C_t\}"><span data-formula="\{C_t\}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2020.3 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 4.571ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="7B" d="M434 -231Q434 -244 428 -250H410Q281 -250 230 -184Q225 -177 222 -172T217 -161T213 -148T211 -133T210 -111T209 -84T209 -47T209 0Q209 21 209 53Q208 142 204 153Q203 154 203 155Q189 191 153 211T82 231Q71 231 68 234T65 250T68 266T82 269Q116 269 152 289T203 345Q208 356 208 377T209 529V579Q209 634 215 656T244 698Q270 724 324 740Q361 748 377 749Q379 749 390 749T408 750H428Q434 744 434 732Q434 719 431 716Q429 713 415 713Q362 710 332 689T296 647Q291 634 291 499V417Q291 370 288 353T271 314Q240 271 184 255L170 250L184 245Q202 239 220 230T262 196T290 137Q291 131 291 1Q291 -134 296 -147Q306 -174 339 -192T415 -213Q429 -213 431 -216Q434 -219 434 -231Z"></path></g><g data-mml-node="msub" transform="translate(500, 0)"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="mi" transform="translate(715, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1520.3, 0)"><path data-c="7D" d="M65 731Q65 745 68 747T88 750Q171 750 216 725T279 670Q288 649 289 635T291 501Q292 362 293 357Q306 312 345 291T417 269Q428 269 431 266T434 250T431 234T417 231Q380 231 345 210T298 157Q293 143 292 121T291 -28V-79Q291 -134 285 -156T256 -198Q202 -250 89 -250Q71 -250 68 -247T65 -230Q65 -224 65 -223T66 -218T69 -214T77 -213Q91 -213 108 -210T146 -200T183 -177T207 -139Q208 -134 209 3L210 139Q223 196 280 230Q315 247 330 250Q305 257 280 270Q225 304 212 352L210 362L209 498Q208 635 207 640Q195 680 154 696T77 713Q68 713 67 716T65 731Z"></path></g></g></g><g></g></svg></span></span><span leaf="">。不同于传统网格方法，SINF 将视频建模为一个可微时空场，并学习如下参数化映射：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="F_{\Theta} : (\mathbf{s}, \tau) \mapsto \widehat{\mathbf{c}} \in \mathbb{R}^3,
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -883.2 8963 1133.2" aria-hidden="true" style="max-width: 300%;vertical-align: -0.566ex;width: 20.278ex;height: 2.564ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="46" d="M48 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H742Q749 676 749 669Q749 664 736 557T722 447Q720 440 702 440H690Q683 445 683 453Q683 454 686 477T689 530Q689 560 682 579T663 610T626 626T575 633T503 634H480Q398 633 393 631Q388 629 386 623Q385 622 352 492L320 363H375Q378 363 398 363T426 364T448 367T472 374T489 386Q502 398 511 419T524 457T529 475Q532 480 548 480H560Q567 475 567 470Q567 467 536 339T502 207Q500 200 482 200H470Q463 206 463 212Q463 215 468 234T473 274Q473 303 453 310T364 317H309L277 190Q245 66 245 60Q245 46 334 46H359Q365 40 365 39T363 19Q359 6 353 0H336Q295 2 185 2Q120 2 86 2T48 1Z"></path></g><g data-mml-node="TeXAtom" transform="translate(643, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="398" d="M56 340Q56 423 86 494T164 610T270 680T388 705Q521 705 621 601T722 341Q722 260 693 191T617 75T510 4T388 -22T267 3T160 74T85 189T56 340ZM610 339Q610 428 590 495T535 598T463 651T384 668Q332 668 289 638T221 566Q168 485 168 339Q168 274 176 235Q189 158 228 105T324 28Q356 16 388 16Q415 16 442 24T501 54T555 111T594 205T610 339ZM223 263V422H263V388H514V422H554V263H514V297H263V263H223Z"></path></g></g></g><g data-mml-node="mo" transform="translate(1520.9, 0)"><path data-c="3A" d="M78 370Q78 394 95 412T138 430Q162 430 180 414T199 371Q199 346 182 328T139 310T96 327T78 370ZM78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g><g data-mml-node="mo" transform="translate(2076.7, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(2465.7, 0)"><g data-mml-node="mi"><path data-c="73" d="M38 315Q38 339 45 360T70 404T127 440T223 453Q273 453 320 436L338 445L357 453H366Q380 453 383 447T386 403V387V355Q386 331 383 326T365 321H355H349Q333 321 329 324T324 341Q317 406 224 406H216Q123 406 123 353Q123 334 143 321T188 304T244 294T285 286Q305 281 325 273T373 237T412 172Q414 162 414 142Q414 -6 230 -6Q154 -6 117 22L68 -6H58Q44 -6 41 0T38 42V73Q38 85 38 101T37 122Q37 144 42 148T68 153H75Q87 153 91 151T97 147T103 132Q131 46 220 46H230Q257 46 265 47Q330 58 330 108Q330 127 316 142Q300 156 284 162Q271 168 212 178T122 202Q38 243 38 315Z"></path></g></g><g data-mml-node="mo" transform="translate(2919.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(3364.4, 0)"><path data-c="3C4" d="M39 284Q18 284 18 294Q18 301 45 338T99 398Q134 425 164 429Q170 431 332 431Q492 431 497 429Q517 424 517 402Q517 388 508 376T485 360Q479 358 389 358T299 356Q298 355 283 274T251 109T233 20Q228 5 215 -4T186 -13Q153 -13 153 20V30L203 192Q214 228 227 272T248 336L254 357Q254 358 208 358Q206 358 197 358T183 359Q105 359 61 295Q56 287 53 286T39 284Z"></path></g><g data-mml-node="mo" transform="translate(3881.4, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(4548.1, 0)"><path data-c="21A6" d="M95 155V109Q95 83 92 73T75 63Q61 63 58 74T54 130Q54 140 54 180T55 250Q55 421 57 425Q61 437 75 437Q88 437 91 428T95 393V345V270H835Q719 357 692 493Q692 494 692 496T691 499Q691 511 708 511H711Q720 511 723 510T729 506T732 497T735 481T743 456Q765 389 816 336T935 261Q944 258 944 250Q944 244 939 241T915 231T877 212Q836 186 806 152T761 85T740 35T732 4Q730 -6 727 -8T711 -11Q691 -11 691 0Q691 7 696 25Q728 151 835 230H95V155Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(5825.9, 0)"><g data-mml-node="mover"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="63" d="M447 131H458Q478 131 478 117Q478 112 471 95T439 51T377 9Q330 -6 286 -6Q196 -6 135 35Q39 96 39 222Q39 324 101 384Q169 453 286 453Q359 453 411 431T464 353Q464 319 445 302T395 284Q360 284 343 305T325 353Q325 380 338 396H333Q317 398 295 398H292Q280 398 271 397T245 390T218 373T197 338T183 283Q182 275 182 231Q182 199 184 180T193 132T220 85T270 57Q289 50 317 50H326Q385 50 414 115Q419 127 423 129T447 131Z"></path></g></g><g data-mml-node="mo" transform="translate(5.5, -18)"><path data-c="2C6" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g><g data-mml-node="mo" transform="translate(6614.7, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="msup" transform="translate(7559.5, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="52" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g><g data-mml-node="mn" transform="translate(722, 413) scale(0.707)"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path></g></g><g data-mml-node="mo" transform="translate(8685, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在整数时间索引 </span><span style="cursor:pointer;" data-formula="τ=t"><span data-formula="τ=t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2513.6 950" aria-hidden="true" style="vertical-align: -0.452ex;width: 5.687ex;height: 2.149ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g><g data-mml-node="mo" transform="translate(1096.8, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mi" transform="translate(2152.6, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 处，模型输出对应帧的去噪结果；在非整数时间位置，模型也能够形成连续时间上的隐式表示。这意味着 SINF 不只是对离散帧做滤波，而是在重建一个底层连续视频信号流形。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">整体而言，SINF 由三个核心模块组成：Blind-Spot Implicit Neural Field（BS-INF）、Implicit Temporal Embedding（ITE）和 Time-Aware Spatial Graph Module（TSGM）。其中，BS-INF 负责在满足 blind-spot 自监督约束的同时扩大空间建模能力；ITE 负责将时间坐标嵌入连续隐式空间，增强动态建模能力；TSGM 负责通过时间感知图注意力机制完成跨帧对齐与融合，减少对显式光流的依赖。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">五、自监督学习范式：如何在没有干净标签的情况下训练？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">无监督视频去噪的关键挑战在于如何避免模型直接复制噪声输入。如果网络能够看到目标像素自身，那么最简单的优化方式就是输出原始噪声值，从而退化为恒等映射，随机遮挡部分目标像素，使模型只能根据其周围空间—时间上下文进行预测。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">对于任意被遮挡位置 </span><span style="cursor:pointer;" data-formula="\mathbf{x}\mathcal{∈M}"><span data-formula="\mathbf{x}\mathcal{∈M}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 2752.8 755" aria-hidden="true" style="vertical-align: -0.113ex;width: 6.228ex;height: 1.708ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(607, 0)"><g data-mml-node="mo"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="mi" transform="translate(944.8, 0)"><path data-c="4D" d="M28 9Q28 37 43 63T73 90Q77 90 83 84T103 70T141 57H146Q162 57 178 79T222 167Q266 279 295 371T334 513T349 598T358 651T371 677Q397 705 432 705Q442 705 445 699T452 666Q453 661 453 659Q475 538 509 405T568 207L574 192Q581 178 587 164T594 150Q596 150 635 189T693 248Q765 324 863 438T1024 626T1089 701Q1093 705 1100 705Q1111 705 1111 682Q1111 675 1108 660T1099 611T1086 540Q1041 277 1041 144Q1041 98 1044 75T1050 48T1059 42Q1064 41 1075 46Q1102 61 1121 61Q1137 61 1137 50Q1137 28 1087 0T1000 -29Q983 -29 972 -23T955 -9T945 16T942 45T941 83V96Q941 158 952 256T974 422L985 489Q984 489 939 436T821 300T698 164Q665 128 620 85T568 37Q564 34 558 34Q550 34 546 37T535 54Q512 91 496 127T450 259T389 498L384 518Q349 367 294 223T198 15Q155 -50 117 -50Q87 -50 61 -35T30 -6Q28 2 28 9Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">，模型预测满足：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\widehat{C}_t(\mathbf{x}) = f(I_t^{(\mathcal{M})}, \{I_{t-k}, \dots, I_{t+k}\}) \Big|_{\mathbf{x}},\frac{\partial \widehat{C}_t(\mathbf{x})}{\partial I_t(\mathbf{x})} = 0
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1768 20705 2728" aria-hidden="true" style="max-width: 300%;vertical-align: -2.172ex;width: 46.844ex;height: 6.172ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="mo" transform="translate(219, 214)"><path data-c="2C6" d="M279 669Q273 669 142 610T9 551L0 569Q-8 585 -8 587Q-8 588 -7 588L12 598Q30 608 66 628T136 666L277 744L564 587L555 569Q549 556 547 554T544 552Q539 555 410 612T279 669Z"></path></g></g></g><g data-mml-node="mi" transform="translate(775.1, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1080.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1469.3, 0)"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g><g data-mml-node="mo" transform="translate(2076.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(2743.1, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mi" transform="translate(3798.9, 0)"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="mo" transform="translate(4348.9, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msubsup" transform="translate(4737.9, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="TeXAtom" transform="translate(566.8, 530.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(389, 0)"><g data-mml-node="mi"><path data-c="4D" d="M28 9Q28 37 43 63T73 90Q77 90 83 84T103 70T141 57H146Q162 57 178 79T222 167Q266 279 295 371T334 513T349 598T358 651T371 677Q397 705 432 705Q442 705 445 699T452 666Q453 661 453 659Q475 538 509 405T568 207L574 192Q581 178 587 164T594 150Q596 150 635 189T693 248Q765 324 863 438T1024 626T1089 701Q1093 705 1100 705Q1111 705 1111 682Q1111 675 1108 660T1099 611T1086 540Q1041 277 1041 144Q1041 98 1044 75T1050 48T1059 42Q1064 41 1075 46Q1102 61 1121 61Q1137 61 1137 50Q1137 28 1087 0T1000 -29Q983 -29 972 -23T955 -9T945 16T942 45T941 83V96Q941 158 952 256T974 422L985 489Q984 489 939 436T821 300T698 164Q665 128 620 85T568 37Q564 34 558 34Q550 34 546 37T535 54Q512 91 496 127T450 259T389 498L384 518Q349 367 294 223T198 15Q155 -50 117 -50Q87 -50 61 -35T30 -6Q28 2 28 9Z"></path></g></g><g data-mml-node="mo" transform="translate(1590, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g><g data-mml-node="mi" transform="translate(440, -269) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(6754, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mo" transform="translate(7198.7, 0)"><path data-c="7B" d="M434 -231Q434 -244 428 -250H410Q281 -250 230 -184Q225 -177 222 -172T217 -161T213 -148T211 -133T210 -111T209 -84T209 -47T209 0Q209 21 209 53Q208 142 204 153Q203 154 203 155Q189 191 153 211T82 231Q71 231 68 234T65 250T68 266T82 269Q116 269 152 289T203 345Q208 356 208 377T209 529V579Q209 634 215 656T244 698Q270 724 324 740Q361 748 377 749Q379 749 390 749T408 750H428Q434 744 434 732Q434 719 431 716Q429 713 415 713Q362 710 332 689T296 647Q291 634 291 499V417Q291 370 288 353T271 314Q240 271 184 255L170 250L184 245Q202 239 220 230T262 196T290 137Q291 131 291 1Q291 -134 296 -147Q306 -174 339 -192T415 -213Q429 -213 431 -216Q434 -219 434 -231Z"></path></g><g data-mml-node="msub" transform="translate(7698.7, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="TeXAtom" transform="translate(440, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mi" transform="translate(1139, 0)"><path data-c="6B" d="M121 647Q121 657 125 670T137 683Q138 683 209 688T282 694Q294 694 294 686Q294 679 244 477Q194 279 194 272Q213 282 223 291Q247 309 292 354T362 415Q402 442 438 442Q468 442 485 423T503 369Q503 344 496 327T477 302T456 291T438 288Q418 288 406 299T394 328Q394 353 410 369T442 390L458 393Q446 405 434 405H430Q398 402 367 380T294 316T228 255Q230 254 243 252T267 246T293 238T320 224T342 206T359 180T365 147Q365 130 360 106T354 66Q354 26 381 26Q429 26 459 145Q461 153 479 153H483Q499 153 499 144Q499 139 496 130Q455 -11 378 -11Q333 -11 305 15T277 90Q277 108 280 121T283 145Q283 167 269 183T234 206T200 217T182 220H180Q168 178 159 139T145 81T136 44T129 20T122 7T111 -2Q98 -11 83 -11Q66 -11 57 -1T48 16Q48 26 85 176T158 471L195 616Q196 629 188 632T149 637H144Q134 637 131 637T124 640T121 647Z"></path></g></g></g><g data-mml-node="mo" transform="translate(9362.5, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mo" transform="translate(9807.2, 0)"><path data-c="2026" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60ZM525 60Q525 84 542 102T585 120Q609 120 627 104T646 61Q646 36 629 18T586 0T543 17T525 60ZM972 60Q972 84 989 102T1032 120Q1056 120 1074 104T1093 61Q1093 36 1076 18T1033 0T990 17T972 60Z"></path></g><g data-mml-node="mo" transform="translate(11145.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(11590.5, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="TeXAtom" transform="translate(440, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mi" transform="translate(1139, 0)"><path data-c="6B" d="M121 647Q121 657 125 670T137 683Q138 683 209 688T282 694Q294 694 294 686Q294 679 244 477Q194 279 194 272Q213 282 223 291Q247 309 292 354T362 415Q402 442 438 442Q468 442 485 423T503 369Q503 344 496 327T477 302T456 291T438 288Q418 288 406 299T394 328Q394 353 410 369T442 390L458 393Q446 405 434 405H430Q398 402 367 380T294 316T228 255Q230 254 243 252T267 246T293 238T320 224T342 206T359 180T365 147Q365 130 360 106T354 66Q354 26 381 26Q429 26 459 145Q461 153 479 153H483Q499 153 499 144Q499 139 496 130Q455 -11 378 -11Q333 -11 305 15T277 90Q277 108 280 121T283 145Q283 167 269 183T234 206T200 217T182 220H180Q168 178 159 139T145 81T136 44T129 20T122 7T111 -2Q98 -11 83 -11Q66 -11 57 -1T48 16Q48 26 85 176T158 471L195 616Q196 629 188 632T149 637H144Q134 637 131 637T124 640T121 647Z"></path></g></g></g><g data-mml-node="mo" transform="translate(13254.3, 0)"><path data-c="7D" d="M65 731Q65 745 68 747T88 750Q171 750 216 725T279 670Q288 649 289 635T291 501Q292 362 293 357Q306 312 345 291T417 269Q428 269 431 266T434 250T431 234T417 231Q380 231 345 210T298 157Q293 143 292 121T291 -28V-79Q291 -134 285 -156T256 -198Q202 -250 89 -250Q71 -250 68 -247T65 -230Q65 -224 65 -223T66 -218T69 -214T77 -213Q91 -213 108 -210T146 -200T183 -177T207 -139Q208 -134 209 3L210 139Q223 196 280 230Q315 247 330 250Q305 257 280 270Q225 304 212 352L210 362L209 498Q208 635 207 640Q195 680 154 696T77 713Q68 713 67 716T65 731Z"></path></g><g data-mml-node="mo" transform="translate(13754.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="msub" transform="translate(14143.3, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><svg width="278" height="1623" y="-561.5" x="27.5" viewBox="0 -201 278 1623" style="max-width: 300%;"><path data-c="2223" d="M139 -249H137Q125 -249 119 -235V251L120 737Q130 750 139 750Q152 750 159 735V-235Q151 -249 141 -249H139Z" transform="scale(1, 2.437)"></path><g></g></svg></g></g><g data-mml-node="TeXAtom" transform="translate(333, -596.9) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g></g></g><g data-mml-node="mo" transform="translate(14955.5, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mfrac" transform="translate(15400.2, 0)"><g data-mml-node="mrow" transform="translate(220, 710)"><g data-mml-node="mi"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g><g data-mml-node="msub" transform="translate(566, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="mo" transform="translate(219, 214)"><path data-c="2C6" d="M279 669Q273 669 142 610T9 551L0 569Q-8 585 -8 587Q-8 588 -7 588L12 598Q30 608 66 628T136 666L277 744L564 587L555 569Q549 556 547 554T544 552Q539 555 410 612T279 669Z"></path></g></g></g><g data-mml-node="mi" transform="translate(775.1, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1646.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(2035.3, 0)"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g><g data-mml-node="mo" transform="translate(2642.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g><g data-mml-node="mrow" transform="translate(387.5, -710)"><g data-mml-node="mi"><path data-c="2202" d="M202 508Q179 508 169 520T158 547Q158 557 164 577T185 624T230 675T301 710L333 715H345Q378 715 384 714Q447 703 489 661T549 568T566 457Q566 362 519 240T402 53Q321 -22 223 -22Q123 -22 73 56Q42 102 42 148V159Q42 276 129 370T322 465Q383 465 414 434T455 367L458 378Q478 461 478 515Q478 603 437 639T344 676Q266 676 223 612Q264 606 264 572Q264 547 246 528T202 508ZM430 306Q430 372 401 400T333 428Q270 428 222 382Q197 354 183 323T150 221Q132 149 132 116Q132 21 232 21Q244 21 250 22Q327 35 374 112Q389 137 409 196T430 306Z"></path></g><g data-mml-node="msub" transform="translate(566, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="mi" transform="translate(440, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1311.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1700.3, 0)"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g><g data-mml-node="mo" transform="translate(2307.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g><rect width="3231.3" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(19149.3, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(20205, 0)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">该公式表达了 J-invariance 条件，即预测值不能依赖该位置自身的噪声观测。由于 mask 在训练过程中随机采样，每个像素最终都会在不同迭代中作为预测目标被优化。训练损失定义为 masked mean squared error：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathcal{L}_t = \frac{1}{|\mathcal{M}|} \sum_{\mathbf{x} \in \mathcal{M}} \|\widehat{C}_t(\mathbf{x}) - I_t(\mathbf{x})\|_2^2.
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1342 14108.8 2592.9" aria-hidden="true" style="max-width: 300%;vertical-align: -2.83ex;width: 31.92ex;height: 5.866ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="mi" transform="translate(690, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1273, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mfrac" transform="translate(2328.8, 0)"><g data-mml-node="mn" transform="translate(848.5, 676)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mrow" transform="translate(220, -709.5)"><g data-mml-node="mo"><path data-c="7C" d="M139 -249H137Q125 -249 119 -235V251L120 737Q130 750 139 750Q152 750 159 735V-235Q151 -249 141 -249H139Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(278, 0)"><g data-mml-node="mi"><path data-c="4D" d="M28 9Q28 37 43 63T73 90Q77 90 83 84T103 70T141 57H146Q162 57 178 79T222 167Q266 279 295 371T334 513T349 598T358 651T371 677Q397 705 432 705Q442 705 445 699T452 666Q453 661 453 659Q475 538 509 405T568 207L574 192Q581 178 587 164T594 150Q596 150 635 189T693 248Q765 324 863 438T1024 626T1089 701Q1093 705 1100 705Q1111 705 1111 682Q1111 675 1108 660T1099 611T1086 540Q1041 277 1041 144Q1041 98 1044 75T1050 48T1059 42Q1064 41 1075 46Q1102 61 1121 61Q1137 61 1137 50Q1137 28 1087 0T1000 -29Q983 -29 972 -23T955 -9T945 16T942 45T941 83V96Q941 158 952 256T974 422L985 489Q984 489 939 436T821 300T698 164Q665 128 620 85T568 37Q564 34 558 34Q550 34 546 37T535 54Q512 91 496 127T450 259T389 498L384 518Q349 367 294 223T198 15Q155 -50 117 -50Q87 -50 61 -35T30 -6Q28 2 28 9Z"></path></g></g><g data-mml-node="mo" transform="translate(1479, 0)"><path data-c="7C" d="M139 -249H137Q125 -249 119 -235V251L120 737Q130 750 139 750Q152 750 159 735V-235Q151 -249 141 -249H139Z"></path></g></g><rect width="1957" height="60" x="120" y="220"></rect></g><g data-mml-node="munder" transform="translate(4692.5, 0)"><g data-mml-node="mo" transform="translate(153, 0)"><path data-c="2211" d="M60 948Q63 950 665 950H1267L1325 815Q1384 677 1388 669H1348L1341 683Q1320 724 1285 761Q1235 809 1174 838T1033 881T882 898T699 902H574H543H251L259 891Q722 258 724 252Q725 250 724 246Q721 243 460 -56L196 -356Q196 -357 407 -357Q459 -357 548 -357T676 -358Q812 -358 896 -353T1063 -332T1204 -283T1307 -196Q1328 -170 1348 -124H1388Q1388 -125 1381 -145T1356 -210T1325 -294L1267 -449L666 -450Q64 -450 61 -448Q55 -446 55 -439Q55 -437 57 -433L590 177Q590 178 557 222T452 366T322 544L56 909L55 924Q55 945 60 948Z"></path></g><g data-mml-node="TeXAtom" transform="translate(0, -1115.5) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g><g data-mml-node="mo" transform="translate(607, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1274, 0)"><g data-mml-node="mi"><path data-c="4D" d="M28 9Q28 37 43 63T73 90Q77 90 83 84T103 70T141 57H146Q162 57 178 79T222 167Q266 279 295 371T334 513T349 598T358 651T371 677Q397 705 432 705Q442 705 445 699T452 666Q453 661 453 659Q475 538 509 405T568 207L574 192Q581 178 587 164T594 150Q596 150 635 189T693 248Q765 324 863 438T1024 626T1089 701Q1093 705 1100 705Q1111 705 1111 682Q1111 675 1108 660T1099 611T1086 540Q1041 277 1041 144Q1041 98 1044 75T1050 48T1059 42Q1064 41 1075 46Q1102 61 1121 61Q1137 61 1137 50Q1137 28 1087 0T1000 -29Q983 -29 972 -23T955 -9T945 16T942 45T941 83V96Q941 158 952 256T974 422L985 489Q984 489 939 436T821 300T698 164Q665 128 620 85T568 37Q564 34 558 34Q550 34 546 37T535 54Q512 91 496 127T450 259T389 498L384 518Q349 367 294 223T198 15Q155 -50 117 -50Q87 -50 61 -35T30 -6Q28 2 28 9Z"></path></g></g></g></g><g data-mml-node="mo" transform="translate(6609.2, 0)"><path data-c="2225" d="M133 736Q138 750 153 750Q164 750 170 739Q172 735 172 250T170 -239Q164 -250 152 -250Q144 -250 138 -244L137 -243Q133 -241 133 -179T132 250Q132 731 133 736ZM329 739Q334 750 346 750Q353 750 361 744L362 743Q366 741 366 679T367 250T367 -178T362 -243L361 -244Q355 -250 347 -250Q335 -250 329 -239Q327 -235 327 250T329 739Z"></path></g><g data-mml-node="msub" transform="translate(7109.2, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="mo" transform="translate(219, 214)"><path data-c="2C6" d="M279 669Q273 669 142 610T9 551L0 569Q-8 585 -8 587Q-8 588 -7 588L12 598Q30 608 66 628T136 666L277 744L564 587L555 569Q549 556 547 554T544 552Q539 555 410 612T279 669Z"></path></g></g></g><g data-mml-node="mi" transform="translate(775.1, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(8189.6, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(8578.6, 0)"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g><g data-mml-node="mo" transform="translate(9185.6, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(9796.8, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="msub" transform="translate(10797, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="mi" transform="translate(440, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(11542.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(11931.3, 0)"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g><g data-mml-node="mo" transform="translate(12538.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="msubsup" transform="translate(12927.3, 0)"><g data-mml-node="mo"><path data-c="2225" d="M133 736Q138 750 153 750Q164 750 170 739Q172 735 172 250T170 -239Q164 -250 152 -250Q144 -250 138 -244L137 -243Q133 -241 133 -179T132 250Q132 731 133 736ZM329 739Q334 750 346 750Q353 750 361 744L362 743Q366 741 366 679T367 250T367 -178T362 -243L361 -244Q355 -250 347 -250Q335 -250 329 -239Q327 -235 327 250T329 739Z"></path></g><g data-mml-node="mn" transform="translate(500, 413) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="mn" transform="translate(500, -247) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="mo" transform="translate(13830.8, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">与传统 blind-spot 网络不同的是，SINF 并没有停留在局部卷积邻域内，而是进一步通过隐式坐标场和时空图对齐机制扩大可利用上下文范围，从而增强复杂场景中的细节恢复能力。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">盲点隐式场：Blind-Spot Implicit Neural Field</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">Blind-Spot Implicit Neural Field（BS-INF）是 SINF 的空间建模核心。传统 blind-spot 网络通过遮挡中心像素避免信息泄漏，但其预测仍然依赖卷积感受野内的局部邻域。当噪声较强或纹理结构较复杂时，有限邻域不足以提供可靠上下文。BS-INF 的目标是在保持 blind-spot 自监督约束的同时，引入坐标驱动的隐式表示，使模型能够获得更丰富的全局空间信息。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">具体而言，对于帧 </span><span style="cursor:pointer;" data-formula="τ"><span data-formula="τ"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 819 950" aria-hidden="true" style="vertical-align: -0.452ex;width: 1.853ex;height: 2.149ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g></g><g></g></svg></span></span><span leaf=""> 的特征图 </span><span style="cursor:pointer;" data-formula="\mathbf{F}_τ"><span data-formula="\mathbf{F}_τ"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -680 1353.1 998.2" aria-hidden="true" style="vertical-align: -0.72ex;width: 3.061ex;height: 2.258ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="46" d="M425 0L228 3Q63 3 51 0H39V62H147V618H39V680H644V676Q647 670 659 552T675 428V424H613Q613 433 605 477Q599 511 589 535T562 574T530 599T488 612T441 617T387 618H368H304V371H333Q389 373 411 390T437 468V488H499V192H437V212Q436 244 430 263T408 292T378 305T333 309H304V62H439V0H425Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(724, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g></g></g><g></g></svg></span></span><span leaf="">，模型首先使用 MaskConv 去除中心像素信息，再通过 DilatedConv 扩大局部感受野：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{U}_τ=\mathrm{DilatedConv}(\mathrm{MaskConv}(\mathbf{F}_τ)).
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 16194.8 1068.2" aria-hidden="true" style="max-width: 300%;vertical-align: -0.72ex;width: 36.64ex;height: 2.417ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="55" d="M570 686Q588 683 703 683T836 686H845V624H737V420Q737 390 737 345T738 284Q738 205 729 164T689 83Q614 -11 465 -11Q321 -11 240 51T148 207Q147 214 147 421V624H39V686H51Q75 683 226 683Q376 683 400 686H412V624H304V405V370V268Q304 181 311 146T346 87Q387 52 466 52Q642 52 667 195Q668 204 669 415V624H561V686H570Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(885, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(1791.9, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(2847.7, 0)"><g data-mml-node="mi"><path data-c="44" d="M130 622Q123 629 119 631T103 634T60 637H27V683H228Q399 682 419 682T461 676Q504 667 546 641T626 573T685 470T708 336Q708 210 634 116T442 3Q429 1 228 0H27V46H60Q102 47 111 49T130 61V622ZM593 338Q593 439 571 501T493 602Q439 637 355 637H322H294Q238 637 234 628Q231 624 231 344Q231 62 232 59Q233 49 248 48T339 46H350Q456 46 515 95Q561 133 577 191T593 338Z"></path></g><g data-mml-node="mi" transform="translate(764, 0)"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path></g><g data-mml-node="mi" transform="translate(1042, 0)"><path data-c="6C" d="M42 46H56Q95 46 103 60V68Q103 77 103 91T103 124T104 167T104 217T104 272T104 329Q104 366 104 407T104 482T104 542T103 586T103 603Q100 622 89 628T44 637H26V660Q26 683 28 683L38 684Q48 685 67 686T104 688Q121 689 141 690T171 693T182 694H185V379Q185 62 186 60Q190 52 198 49Q219 46 247 46H263V0H255L232 1Q209 2 183 2T145 3T107 3T57 1L34 0H26V46H42Z"></path></g><g data-mml-node="mi" transform="translate(1320, 0)"><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z"></path></g><g data-mml-node="mi" transform="translate(1820, 0)"><path data-c="74" d="M27 422Q80 426 109 478T141 600V615H181V431H316V385H181V241Q182 116 182 100T189 68Q203 29 238 29Q282 29 292 100Q293 108 293 146V181H333V146V134Q333 57 291 17Q264 -10 221 -10Q187 -10 162 2T124 33T105 68T98 100Q97 107 97 248V385H18V422H27Z"></path></g><g data-mml-node="mi" transform="translate(2209, 0)"><path data-c="65" d="M28 218Q28 273 48 318T98 391T163 433T229 448Q282 448 320 430T378 380T406 316T415 245Q415 238 408 231H126V216Q126 68 226 36Q246 30 270 30Q312 30 342 62Q359 79 369 104L379 128Q382 131 395 131H398Q415 131 415 121Q415 117 412 108Q393 53 349 21T250 -11Q155 -11 92 58T28 218ZM333 275Q322 403 238 411H236Q228 411 220 410T195 402T166 381T143 340T127 274V267H333V275Z"></path></g><g data-mml-node="mi" transform="translate(2653, 0)"><path data-c="64" d="M376 495Q376 511 376 535T377 568Q377 613 367 624T316 637H298V660Q298 683 300 683L310 684Q320 685 339 686T376 688Q393 689 413 690T443 693T454 694H457V390Q457 84 458 81Q461 61 472 55T517 46H535V0Q533 0 459 -5T380 -11H373V44L365 37Q307 -11 235 -11Q158 -11 96 50T34 215Q34 315 97 378T244 442Q319 442 376 393V495ZM373 342Q328 405 260 405Q211 405 173 369Q146 341 139 305T131 211Q131 155 138 120T173 59Q203 26 251 26Q322 26 373 103V342Z"></path></g><g data-mml-node="mi" transform="translate(3209, 0)"><path data-c="43" d="M56 342Q56 428 89 500T174 615T283 681T391 705Q394 705 400 705T408 704Q499 704 569 636L582 624L612 663Q639 700 643 704Q644 704 647 704T653 705H657Q660 705 666 699V419L660 413H626Q620 419 619 430Q610 512 571 572T476 651Q457 658 426 658Q322 658 252 588Q173 509 173 342Q173 221 211 151Q232 111 263 84T328 45T384 29T428 24Q517 24 571 93T626 244Q626 251 632 257H660L666 251V236Q661 133 590 56T403 -21Q262 -21 159 83T56 342Z"></path></g><g data-mml-node="mi" transform="translate(3931, 0)"><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z"></path></g><g data-mml-node="mi" transform="translate(4431, 0)"><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path></g><g data-mml-node="mi" transform="translate(4987, 0)"><path data-c="76" d="M338 431Q344 429 422 429Q479 429 503 431H508V385H497Q439 381 423 345Q421 341 356 172T288 -2Q283 -11 263 -11Q244 -11 239 -2Q99 359 98 364Q93 378 82 381T43 385H19V431H25L33 430Q41 430 53 430T79 430T104 429T122 428Q217 428 232 431H240V385H226Q187 384 184 370Q184 366 235 234L286 102L377 341V349Q377 363 367 372T349 383T335 385H331V431H338Z"></path></g></g><g data-mml-node="mo" transform="translate(8362.7, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(8751.7, 0)"><g data-mml-node="mi"><path data-c="4D" d="M132 622Q125 629 121 631T105 634T62 637H29V683H135Q221 683 232 682T249 675Q250 674 354 398L458 124L562 398Q666 674 668 675Q671 681 683 682T781 683H887V637H854Q814 636 803 634T785 622V61Q791 51 802 49T854 46H887V0H876Q855 3 736 3Q605 3 596 0H585V46H618Q660 47 669 49T688 61V347Q688 424 688 461T688 546T688 613L687 632Q454 14 450 7Q446 1 430 1T410 7Q409 9 292 316L176 624V606Q175 588 175 543T175 463T175 356L176 86Q187 50 261 46H278V0H269Q254 3 154 3Q52 3 37 0H29V46H46Q78 48 98 56T122 69T132 86V622Z"></path></g><g data-mml-node="mi" transform="translate(917, 0)"><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z"></path></g><g data-mml-node="mi" transform="translate(1417, 0)"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path></g><g data-mml-node="mi" transform="translate(1811, 0)"><path data-c="6B" d="M36 46H50Q89 46 97 60V68Q97 77 97 91T97 124T98 167T98 217T98 272T98 329Q98 366 98 407T98 482T98 542T97 586T97 603Q94 622 83 628T38 637H20V660Q20 683 22 683L32 684Q42 685 61 686T98 688Q115 689 135 690T165 693T176 694H179V463L180 233L240 287Q300 341 304 347Q310 356 310 364Q310 383 289 385H284V431H293Q308 428 412 428Q475 428 484 431H489V385H476Q407 380 360 341Q286 278 286 274Q286 273 349 181T420 79Q434 60 451 53T500 46H511V0H505Q496 3 418 3Q322 3 307 0H299V46H306Q330 48 330 65Q330 72 326 79Q323 84 276 153T228 222L176 176V120V84Q176 65 178 59T189 49Q210 46 238 46H254V0H246Q231 3 137 3T28 0H20V46H36Z"></path></g><g data-mml-node="mi" transform="translate(2339, 0)"><path data-c="43" d="M56 342Q56 428 89 500T174 615T283 681T391 705Q394 705 400 705T408 704Q499 704 569 636L582 624L612 663Q639 700 643 704Q644 704 647 704T653 705H657Q660 705 666 699V419L660 413H626Q620 419 619 430Q610 512 571 572T476 651Q457 658 426 658Q322 658 252 588Q173 509 173 342Q173 221 211 151Q232 111 263 84T328 45T384 29T428 24Q517 24 571 93T626 244Q626 251 632 257H660L666 251V236Q661 133 590 56T403 -21Q262 -21 159 83T56 342Z"></path></g><g data-mml-node="mi" transform="translate(3061, 0)"><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z"></path></g><g data-mml-node="mi" transform="translate(3561, 0)"><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path></g><g data-mml-node="mi" transform="translate(4117, 0)"><path data-c="76" d="M338 431Q344 429 422 429Q479 429 503 431H508V385H497Q439 381 423 345Q421 341 356 172T288 -2Q283 -11 263 -11Q244 -11 239 -2Q99 359 98 364Q93 378 82 381T43 385H19V431H25L33 430Q41 430 53 430T79 430T104 429T122 428Q217 428 232 431H240V385H226Q187 384 184 370Q184 366 235 234L286 102L377 341V349Q377 363 367 372T349 383T335 385H331V431H338Z"></path></g></g><g data-mml-node="mo" transform="translate(13396.7, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(13785.7, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="46" d="M425 0L228 3Q63 3 51 0H39V62H147V618H39V680H644V676Q647 670 659 552T675 428V424H613Q613 433 605 477Q599 511 589 535T562 574T530 599T488 612T441 617T387 618H368H304V371H333Q389 373 411 390T437 468V488H499V192H437V212Q436 244 430 263T408 292T378 305T333 309H304V62H439V0H425Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(724, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(15138.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(15527.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(15916.8, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这一分支用于提取局部 blind-spot 上下文。与此同时，BS-INF 构建坐标隐式分支，将空间和时间坐标归一化到</span><span style="cursor:pointer;" data-formula="[−1,1]"><span data-formula="[−1,1]"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2778.7 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 6.287ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="5B" d="M118 -250V750H255V710H158V-210H255V-250H118Z"></path></g><g data-mml-node="mo" transform="translate(278, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(1056, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(1556, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mn" transform="translate(2000.7, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(2500.7, 0)"><path data-c="5D" d="M22 710V750H159V-250H22V-210H119V710H22Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 范围：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\tilde{x} = \frac{2x}{W} - 1, \quad \tilde{y} = \frac{2y}{H} - 1, \quad \tilde{t} = \frac{2\tau}{T} - 1,
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1342 18445.2 2050" aria-hidden="true" style="max-width: 300%;vertical-align: -1.602ex;width: 41.731ex;height: 4.638ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, 287)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(849.8, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mfrac" transform="translate(1905.6, 0)"><g data-mml-node="mrow" transform="translate(220, 676)"><g data-mml-node="mn"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="mi" transform="translate(500, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g></g><g data-mml-node="mi" transform="translate(232, -686)"><path data-c="57" d="M436 683Q450 683 486 682T553 680Q604 680 638 681T677 682Q695 682 695 674Q695 670 692 659Q687 641 683 639T661 637Q636 636 621 632T600 624T597 615Q597 603 613 377T629 138L631 141Q633 144 637 151T649 170T666 200T690 241T720 295T759 362Q863 546 877 572T892 604Q892 619 873 628T831 637Q817 637 817 647Q817 650 819 660Q823 676 825 679T839 682Q842 682 856 682T895 682T949 681Q1015 681 1034 683Q1048 683 1048 672Q1048 666 1045 655T1038 640T1028 637Q1006 637 988 631T958 617T939 600T927 584L923 578L754 282Q586 -14 585 -15Q579 -22 561 -22Q546 -22 542 -17Q539 -14 523 229T506 480L494 462Q472 425 366 239Q222 -13 220 -15T215 -19Q210 -22 197 -22Q178 -22 176 -15Q176 -12 154 304T131 622Q129 631 121 633T82 637H58Q51 644 51 648Q52 671 64 683H76Q118 680 176 680Q301 680 313 683H323Q329 677 329 674T327 656Q322 641 318 637H297Q236 634 232 620Q262 160 266 136L501 550L499 587Q496 629 489 632Q483 636 447 637Q428 637 422 639T416 648Q416 650 418 660Q419 664 420 669T421 676T424 680T428 682T436 683Z"></path></g><rect width="1272" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(3639.8, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(4640, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(5140, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mstyle" transform="translate(5584.7, 0)"><g data-mml-node="mspace"></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(6584.7, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(5, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(55.6, 287)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(7418, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mfrac" transform="translate(8473.8, 0)"><g data-mml-node="mrow" transform="translate(220, 676)"><g data-mml-node="mn"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="mi" transform="translate(500, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mi" transform="translate(271, -686)"><path data-c="48" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 219 683Q260 681 355 681Q389 681 418 681T463 682T483 682Q499 682 499 672Q499 670 497 658Q492 641 487 638H485Q483 638 480 638T473 638T464 637T455 637Q416 636 405 634T387 623Q384 619 355 500Q348 474 340 442T328 395L324 380Q324 378 469 378H614L615 381Q615 384 646 504Q674 619 674 627T617 637Q594 637 587 639T580 648Q580 650 582 660Q586 677 588 679T604 682Q609 682 646 681T740 680Q802 680 835 681T871 682Q888 682 888 672Q888 645 876 638H874Q872 638 869 638T862 638T853 637T844 637Q805 636 794 634T776 623Q773 618 704 340T634 58Q634 51 638 51Q646 48 692 46H723Q729 38 729 37T726 19Q722 6 716 0H701Q664 2 567 2Q533 2 504 2T458 2T437 1Q420 1 420 10Q420 15 423 24Q428 43 433 45Q437 46 448 46H454Q481 46 514 49Q520 50 522 50T528 55T534 64T540 82T547 110T558 153Q565 181 569 198Q602 330 602 331T457 332H312L279 197Q245 63 245 58Q245 51 253 49T303 46H334Q340 38 340 37T337 19Q333 6 327 0H312Q275 2 178 2Q144 2 115 2T69 2T48 1Q31 1 31 10Q31 12 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><rect width="1190" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(10126, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(11126.3, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(11626.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mstyle" transform="translate(12070.9, 0)"><g data-mml-node="mspace"></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(13070.9, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(13932, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mfrac" transform="translate(14987.8, 0)"><g data-mml-node="mrow" transform="translate(220, 676)"><g data-mml-node="mn"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="mi" transform="translate(500, 0)"><path data-c="3C4" d="M39 284Q18 284 18 294Q18 301 45 338T99 398Q134 425 164 429Q170 431 332 431Q492 431 497 429Q517 424 517 402Q517 388 508 376T485 360Q479 358 389 358T299 356Q298 355 283 274T251 109T233 20Q228 5 215 -4T186 -13Q153 -13 153 20V30L203 192Q214 228 227 272T248 336L254 357Q254 358 208 358Q206 358 197 358T183 359Q105 359 61 295Q56 287 53 286T39 284Z"></path></g></g><g data-mml-node="mi" transform="translate(376.5, -686)"><path data-c="54" d="M40 437Q21 437 21 445Q21 450 37 501T71 602L88 651Q93 669 101 677H569H659Q691 677 697 676T704 667Q704 661 687 553T668 444Q668 437 649 437Q640 437 637 437T631 442L629 445Q629 451 635 490T641 551Q641 586 628 604T573 629Q568 630 515 631Q469 631 457 630T439 622Q438 621 368 343T298 60Q298 48 386 46Q418 46 427 45T436 36Q436 31 433 22Q429 4 424 1L422 0Q419 0 415 0Q410 0 363 1T228 2Q99 2 64 0H49Q43 6 43 9T45 27Q49 40 55 46H83H94Q174 46 189 55Q190 56 191 56Q196 59 201 76T241 233Q258 301 269 344Q339 619 339 625Q339 630 310 630H279Q212 630 191 624Q146 614 121 583T67 467Q60 445 57 441T43 437H40Z"></path></g><rect width="1217" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(16667, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(17667.2, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(18167.2, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">随后将归一化坐标嵌入多频率 Fourier 空间：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="γ(\mathbf{p})=[\mathrm{sin}⁡(2^b π\mathbf{p}),\mathrm{cos}⁡(2^b π\mathbf{p})]^B_{b=0},\mathbf{p}=(\tilde{x},\tilde{y},\tilde{t}).
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -903.7 20645.4 1219.4" aria-hidden="true" style="max-width: 300%;vertical-align: -0.714ex;width: 46.709ex;height: 2.759ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">γ</tspan></text></g></g><g data-mml-node="mo" transform="translate(819, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1208, 0)"><g data-mml-node="mi"><path data-c="70" d="M32 442L123 446Q214 450 215 450H221V409Q222 409 229 413T251 423T284 436T328 446T382 450Q480 450 540 388T600 223Q600 128 539 61T361 -6H354Q292 -6 236 28L227 34V-132H296V-194H287Q269 -191 163 -191Q56 -191 38 -194H29V-132H98V113V284Q98 330 97 348T93 370T83 376Q69 380 42 380H29V442H32ZM457 224Q457 303 427 349T350 395Q282 395 235 352L227 345V104L233 97Q274 45 337 45Q383 45 420 86T457 224Z"></path></g></g><g data-mml-node="mo" transform="translate(1847, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(2513.8, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(3569.6, 0)"><path data-c="5B" d="M118 -250V750H255V710H158V-210H255V-250H118Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3847.6, 0)"><g data-mml-node="mi"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path></g><g data-mml-node="mi" transform="translate(394, 0)"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path></g><g data-mml-node="mi" transform="translate(672, 0)"><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(5075.6, 0)"><g data-mml-node="mo"><path data-c="2061" d=""></path></g></g><g data-mml-node="mo" transform="translate(5075.6, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msup" transform="translate(5464.6, 0)"><g data-mml-node="mn"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="mi" transform="translate(500, 413) scale(0.707)"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(6317.9, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">π</tspan></text></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(7136.9, 0)"><g data-mml-node="mi"><path data-c="70" d="M32 442L123 446Q214 450 215 450H221V409Q222 409 229 413T251 423T284 436T328 446T382 450Q480 450 540 388T600 223Q600 128 539 61T361 -6H354Q292 -6 236 28L227 34V-132H296V-194H287Q269 -191 163 -191Q56 -191 38 -194H29V-132H98V113V284Q98 330 97 348T93 370T83 376Q69 380 42 380H29V442H32ZM457 224Q457 303 427 349T350 395Q282 395 235 352L227 345V104L233 97Q274 45 337 45Q383 45 420 86T457 224Z"></path></g></g><g data-mml-node="mo" transform="translate(7775.9, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(8164.9, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(8609.6, 0)"><g data-mml-node="mi"><path data-c="63" d="M370 305T349 305T313 320T297 358Q297 381 312 396Q317 401 317 402T307 404Q281 408 258 408Q209 408 178 376Q131 329 131 219Q131 137 162 90Q203 29 272 29Q313 29 338 55T374 117Q376 125 379 127T395 129H409Q415 123 415 120Q415 116 411 104T395 71T366 33T318 2T249 -11Q163 -11 99 53T34 214Q34 318 99 383T250 448T370 421T404 357Q404 334 387 320Z"></path></g><g data-mml-node="mi" transform="translate(444, 0)"><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z"></path></g><g data-mml-node="mi" transform="translate(944, 0)"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(9947.6, 0)"><g data-mml-node="mo"><path data-c="2061" d=""></path></g></g><g data-mml-node="mo" transform="translate(9947.6, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msup" transform="translate(10336.6, 0)"><g data-mml-node="mn"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="mi" transform="translate(500, 413) scale(0.707)"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(11189.9, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">π</tspan></text></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(12008.9, 0)"><g data-mml-node="mi"><path data-c="70" d="M32 442L123 446Q214 450 215 450H221V409Q222 409 229 413T251 423T284 436T328 446T382 450Q480 450 540 388T600 223Q600 128 539 61T361 -6H354Q292 -6 236 28L227 34V-132H296V-194H287Q269 -191 163 -191Q56 -191 38 -194H29V-132H98V113V284Q98 330 97 348T93 370T83 376Q69 380 42 380H29V442H32ZM457 224Q457 303 427 349T350 395Q282 395 235 352L227 345V104L233 97Q274 45 337 45Q383 45 420 86T457 224Z"></path></g></g><g data-mml-node="mo" transform="translate(12647.9, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="msubsup" transform="translate(13036.9, 0)"><g data-mml-node="mo"><path data-c="5D" d="M22 710V750H159V-250H22V-210H119V710H22Z"></path></g><g data-mml-node="mi" transform="translate(278, 413) scale(0.707)"><path data-c="42" d="M231 637Q204 637 199 638T194 649Q194 676 205 682Q206 683 335 683Q594 683 608 681Q671 671 713 636T756 544Q756 480 698 429T565 360L555 357Q619 348 660 311T702 219Q702 146 630 78T453 1Q446 0 242 0Q42 0 39 2Q35 5 35 10Q35 17 37 24Q42 43 47 45Q51 46 62 46H68Q95 46 128 49Q142 52 147 61Q150 65 219 339T288 628Q288 635 231 637ZM649 544Q649 574 634 600T585 634Q578 636 493 637Q473 637 451 637T416 636H403Q388 635 384 626Q382 622 352 506Q352 503 351 500L320 374H401Q482 374 494 376Q554 386 601 434T649 544ZM595 229Q595 273 572 302T512 336Q506 337 429 337Q311 337 310 336Q310 334 293 263T258 122L240 52Q240 48 252 48T333 46Q422 46 429 47Q491 54 543 105T595 229Z"></path></g><g data-mml-node="TeXAtom" transform="translate(278, -257.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g><g data-mml-node="mo" transform="translate(429, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(1207, 0)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g><g data-mml-node="mo" transform="translate(14572, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(15016.6, 0)"><g data-mml-node="mi"><path data-c="70" d="M32 442L123 446Q214 450 215 450H221V409Q222 409 229 413T251 423T284 436T328 446T382 450Q480 450 540 388T600 223Q600 128 539 61T361 -6H354Q292 -6 236 28L227 34V-132H296V-194H287Q269 -191 163 -191Q56 -191 38 -194H29V-132H98V113V284Q98 330 97 348T93 370T83 376Q69 380 42 380H29V442H32ZM457 224Q457 303 427 349T350 395Q282 395 235 352L227 345V104L233 97Q274 45 337 45Q383 45 420 86T457 224Z"></path></g></g><g data-mml-node="mo" transform="translate(15933.4, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(16989.2, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(17378.2, 0)"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, 287)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(17950.2, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(18394.8, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(5, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(55.6, 287)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(18950.4, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(19395.1, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(19978.4, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(20367.4, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了确保 blind-spot 约束在坐标域中仍然成立，模型进一步引入二值 mask，对位置编码进行调制：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\tilde{γ}(x,y,τ)=\mathbf{m}(x,y)⋅γ(\tilde{x},\tilde{y},\tilde{t}).
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1013 14141.2 1263" aria-hidden="true" style="max-width: 300%;vertical-align: -0.566ex;width: 31.994ex;height: 2.857ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">γ</tspan></text></g></g><g data-mml-node="mo" transform="translate(159.5, 595)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(819, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1208, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(1780, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(2224.7, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(2714.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3159.3, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g><g data-mml-node="mo" transform="translate(3978.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(4645.1, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(5700.9, 0)"><g data-mml-node="mi"><path data-c="6D" d="M40 442Q217 450 218 450H224V365Q226 367 235 378T254 397T278 416T314 435T362 448Q376 450 400 450H406Q503 450 534 393Q545 376 545 370Q545 368 555 379Q611 450 716 450Q774 450 809 434Q850 414 861 379T873 276V213V198V62H942V0H933Q915 3 809 3Q702 3 684 0H675V62H744V194V275Q744 348 735 373T690 399Q645 399 607 370T557 290Q555 281 554 171V62H623V0H614Q596 3 489 3Q374 3 365 0H356V62H425V194V275Q425 348 416 373T371 399Q326 399 288 370T238 290Q236 281 235 171V62H304V0H295Q277 3 171 3Q64 3 46 0H37V62H106V210V303Q106 353 104 363T91 376Q77 380 50 380H37V442H40Z"></path></g></g><g data-mml-node="mo" transform="translate(6658.9, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(7047.9, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(7619.9, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(8064.6, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(8554.6, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(9165.8, 0)"><path data-c="22C5" d="M78 250Q78 274 95 292T138 310Q162 310 180 294T199 251Q199 226 182 208T139 190T96 207T78 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(9666, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">γ</tspan></text></g></g><g data-mml-node="mo" transform="translate(10485, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(10874, 0)"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, 287)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(11446, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(11890.7, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(5, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(55.6, 287)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(12446.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(12890.9, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(13474.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(13863.2, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这样，隐式场只能利用非中心位置的信息推断被遮挡像素，避免了自监督训练中的目标泄漏。随后，MLP 形式的隐式神经场将坐标编码和局部特征映射为连续潜在表示：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{v}_τ(x,y)=f_θ(\tilde{γ}(x,y,τ),\mathbf{F}_τ(x,y)).
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1013 15479.3 1331.2" aria-hidden="true" style="max-width: 300%;vertical-align: -0.72ex;width: 35.021ex;height: 3.012ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="76" d="M401 444Q413 441 495 441Q568 441 574 444H580V382H510L409 156Q348 18 339 6Q331 -4 320 -4Q318 -4 313 -4T303 -3H288Q273 -3 264 12T221 102Q206 135 197 156L96 382H26V444H34Q49 441 145 441Q252 441 270 444H279V382H231L284 264Q335 149 338 149Q338 150 389 264T442 381Q442 382 418 382H394V444H401Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(607, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(1236.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1625.1, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(2197.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(2641.8, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(3131.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(3798.6, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msub" transform="translate(4854.3, 0)"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="TeXAtom" transform="translate(490, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">θ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(5973.5, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(6362.5, 0)"><g data-mml-node="mover"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">γ</tspan></text></g></g><g data-mml-node="mo" transform="translate(159.5, 595)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(7181.5, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(7570.5, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(8142.5, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(8587.1, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(9077.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(9521.8, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g><g data-mml-node="mo" transform="translate(10340.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(10729.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(11174.5, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="46" d="M425 0L228 3Q63 3 51 0H39V62H147V618H39V680H644V676Q647 670 659 552T675 428V424H613Q613 433 605 477Q599 511 589 535T562 574T530 599T488 612T441 617T387 618H368H304V371H333Q389 373 411 390T437 468V488H499V192H437V212Q436 244 430 263T408 292T378 305T333 309H304V62H439V0H425Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(724, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(12527.6, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(12916.6, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(13488.6, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(13933.3, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(14423.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(14812.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(15201.3, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">BS-INF 同时保留了 blind-spot 自监督学习的有效性和隐式神经场的连续表达能力，使模型能够从更大范围的空间上下文中恢复细节，而不再局限于局部卷积邻域。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">隐式时间编码：Implicit Temporal Embedding</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">传统视频方法通常将时间视为离散帧索引，依赖 RNN、时序卷积或光流传播进行跨帧信息建模。然而，这种方式无法充分描述真实世界中连续发生的运动变化。ITE 将时间变量显式建模为连续坐标，并通过周期激活 MLP 将其嵌入高维隐式空间。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">首先，帧索引 </span><span style="cursor:pointer;" data-formula="t"><span data-formula="t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -626 361 637" aria-hidden="true" style="vertical-align: -0.025ex;width: 0.817ex;height: 1.441ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 被归一化为：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\tilde{t}=\frac{t−1}{T−1},\tilde{t}∈[0,1].
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1342 9312.5 2110" aria-hidden="true" style="max-width: 300%;vertical-align: -1.738ex;width: 21.069ex;height: 4.774ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(861.1, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mfrac" transform="translate(1916.9, 0)"><g data-mml-node="mrow" transform="translate(391.5, 676)"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(583.2, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(1583.4, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="mrow" transform="translate(220, -686)"><g data-mml-node="mi"><path data-c="54" d="M40 437Q21 437 21 445Q21 450 37 501T71 602L88 651Q93 669 101 677H569H659Q691 677 697 676T704 667Q704 661 687 553T668 444Q668 437 649 437Q640 437 637 437T631 442L629 445Q629 451 635 490T641 551Q641 586 628 604T573 629Q568 630 515 631Q469 631 457 630T439 622Q438 621 368 343T298 60Q298 48 386 46Q418 46 427 45T436 36Q436 31 433 22Q429 4 424 1L422 0Q419 0 415 0Q410 0 363 1T228 2Q99 2 64 0H49Q43 6 43 9T45 27Q49 40 55 46H83H94Q174 46 189 55Q190 56 191 56Q196 59 201 76T241 233Q258 301 269 344Q339 619 339 625Q339 630 310 630H279Q212 630 191 624Q146 614 121 583T67 467Q60 445 57 441T43 437H40Z"></path></g><g data-mml-node="mo" transform="translate(926.2, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(1926.4, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><rect width="2626.4" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(4783.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(5228, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(6089, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="mo" transform="translate(7033.8, 0)"><path data-c="5B" d="M118 -250V750H255V710H158V-210H255V-250H118Z"></path></g><g data-mml-node="mn" transform="translate(7311.8, 0)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g><g data-mml-node="mo" transform="translate(7811.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mn" transform="translate(8256.5, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(8756.5, 0)"><path data-c="5D" d="M22 710V750H159V-250H22V-210H119V710H22Z"></path></g><g data-mml-node="mo" transform="translate(9034.5, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">随后，使用 SIREN 风格的时间映射函数得到时间嵌入：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="e_t=\mathrm{Φ}(\tilde{t})=W_2\mathrm{sin}⁡(W_1\tilde{t}+b_1)+b_2.
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -889 15194.1 1139" aria-hidden="true" style="max-width: 300%;vertical-align: -0.566ex;width: 34.376ex;height: 2.577ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="65" d="M39 168Q39 225 58 272T107 350T174 402T244 433T307 442H310Q355 442 388 420T421 355Q421 265 310 237Q261 224 176 223Q139 223 138 221Q138 219 132 186T125 128Q125 81 146 54T209 26T302 45T394 111Q403 121 406 121Q410 121 419 112T429 98T420 82T390 55T344 24T281 -1T205 -11Q126 -11 83 42T39 168ZM373 353Q367 405 305 405Q272 405 244 391T199 357T170 316T154 280T149 261Q149 260 169 260Q282 260 327 284T373 353Z"></path></g><g data-mml-node="mi" transform="translate(466, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1049, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(2104.8, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="3A6" d="M312 622Q310 623 307 625T303 629T297 631T286 634T270 635T246 636T211 637H184V683H196Q220 680 361 680T526 683H538V637H511Q468 637 447 635T422 631T411 622V533L425 531Q525 519 595 466T665 342Q665 301 642 267T583 209T506 172T425 152L411 150V61Q417 55 421 53T447 48T511 46H538V0H526Q502 3 361 3T196 0H184V46H211Q231 46 245 46T270 47T286 48T297 51T303 54T307 57T312 61V150H310Q309 151 289 153T232 166T160 195Q149 201 136 210T103 238T69 284T56 342Q56 414 128 467T294 530Q309 532 310 533H312V622ZM170 342Q170 207 307 188H312V495H309Q301 495 282 491T231 469T186 423Q170 389 170 342ZM415 188Q487 199 519 236T551 342Q551 384 539 414T507 459T470 481T434 491T415 495H410V188H415Z"></path></g></g></g><g data-mml-node="mo" transform="translate(2826.8, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3215.8, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(3799.1, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(4465.9, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msub" transform="translate(5521.7, 0)"><g data-mml-node="mi"><path data-c="57" d="M436 683Q450 683 486 682T553 680Q604 680 638 681T677 682Q695 682 695 674Q695 670 692 659Q687 641 683 639T661 637Q636 636 621 632T600 624T597 615Q597 603 613 377T629 138L631 141Q633 144 637 151T649 170T666 200T690 241T720 295T759 362Q863 546 877 572T892 604Q892 619 873 628T831 637Q817 637 817 647Q817 650 819 660Q823 676 825 679T839 682Q842 682 856 682T895 682T949 681Q1015 681 1034 683Q1048 683 1048 672Q1048 666 1045 655T1038 640T1028 637Q1006 637 988 631T958 617T939 600T927 584L923 578L754 282Q586 -14 585 -15Q579 -22 561 -22Q546 -22 542 -17Q539 -14 523 229T506 480L494 462Q472 425 366 239Q222 -13 220 -15T215 -19Q210 -22 197 -22Q178 -22 176 -15Q176 -12 154 304T131 622Q129 631 121 633T82 637H58Q51 644 51 648Q52 671 64 683H76Q118 680 176 680Q301 680 313 683H323Q329 677 329 674T327 656Q322 641 318 637H297Q236 634 232 620Q262 160 266 136L501 550L499 587Q496 629 489 632Q483 636 447 637Q428 637 422 639T416 648Q416 650 418 660Q419 664 420 669T421 676T424 680T428 682T436 683Z"></path></g><g data-mml-node="mn" transform="translate(944, -150) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(6869.2, 0)"><g data-mml-node="mi"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path></g><g data-mml-node="mi" transform="translate(394, 0)"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path></g><g data-mml-node="mi" transform="translate(672, 0)"><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(8097.2, 0)"><g data-mml-node="mo"><path data-c="2061" d=""></path></g></g><g data-mml-node="mo" transform="translate(8097.2, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(8486.2, 0)"><g data-mml-node="mi"><path data-c="57" d="M436 683Q450 683 486 682T553 680Q604 680 638 681T677 682Q695 682 695 674Q695 670 692 659Q687 641 683 639T661 637Q636 636 621 632T600 624T597 615Q597 603 613 377T629 138L631 141Q633 144 637 151T649 170T666 200T690 241T720 295T759 362Q863 546 877 572T892 604Q892 619 873 628T831 637Q817 637 817 647Q817 650 819 660Q823 676 825 679T839 682Q842 682 856 682T895 682T949 681Q1015 681 1034 683Q1048 683 1048 672Q1048 666 1045 655T1038 640T1028 637Q1006 637 988 631T958 617T939 600T927 584L923 578L754 282Q586 -14 585 -15Q579 -22 561 -22Q546 -22 542 -17Q539 -14 523 229T506 480L494 462Q472 425 366 239Q222 -13 220 -15T215 -19Q210 -22 197 -22Q178 -22 176 -15Q176 -12 154 304T131 622Q129 631 121 633T82 637H58Q51 644 51 648Q52 671 64 683H76Q118 680 176 680Q301 680 313 683H323Q329 677 329 674T327 656Q322 641 318 637H297Q236 634 232 620Q262 160 266 136L501 550L499 587Q496 629 489 632Q483 636 447 637Q428 637 422 639T416 648Q416 650 418 660Q419 664 420 669T421 676T424 680T428 682T436 683Z"></path></g><g data-mml-node="mn" transform="translate(944, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(9833.8, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(10639.3, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="msub" transform="translate(11639.5, 0)"><g data-mml-node="mi"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g><g data-mml-node="mn" transform="translate(429, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="mo" transform="translate(12472.1, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(13083.3, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="msub" transform="translate(14083.5, 0)"><g data-mml-node="mi"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g><g data-mml-node="mn" transform="translate(429, -150) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="mo" transform="translate(14916.1, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了增强对多尺度时间变化的表达能力，论文进一步构造多频率时间编码：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="E_t = [\sin(\omega_1 \tilde{t}), \cos(\omega_1 \tilde{t}), \dots, \sin(\omega_K \tilde{t}), \cos(\omega_K \tilde{t})],
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -889 21557.7 1139" aria-hidden="true" style="max-width: 300%;vertical-align: -0.566ex;width: 48.773ex;height: 2.577ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="45" d="M492 213Q472 213 472 226Q472 230 477 250T482 285Q482 316 461 323T364 330H312Q311 328 277 192T243 52Q243 48 254 48T334 46Q428 46 458 48T518 61Q567 77 599 117T670 248Q680 270 683 272Q690 274 698 274Q718 274 718 261Q613 7 608 2Q605 0 322 0H133Q31 0 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H757Q764 676 764 669Q764 664 751 557T737 447Q735 440 717 440H705Q698 445 698 453L701 476Q704 500 704 528Q704 558 697 578T678 609T643 625T596 632T532 634H485Q397 633 392 631Q388 629 386 622Q385 619 355 499T324 377Q347 376 372 376H398Q464 376 489 391T534 472Q538 488 540 490T557 493Q562 493 565 493T570 492T572 491T574 487T577 483L544 351Q511 218 508 216Q505 213 492 213Z"></path></g><g data-mml-node="mi" transform="translate(738, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1321, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(2376.8, 0)"><path data-c="5B" d="M118 -250V750H255V710H158V-210H255V-250H118Z"></path></g><g data-mml-node="mi" transform="translate(2654.8, 0)"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z" transform="translate(394, 0)"></path><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(672, 0)"></path></g><g data-mml-node="mo" transform="translate(3882.8, 0)"><path data-c="2061" d=""></path></g><g data-mml-node="mo" transform="translate(3882.8, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(4271.8, 0)"><g data-mml-node="mi"><path data-c="3C9" d="M495 384Q495 406 514 424T555 443Q574 443 589 425T604 364Q604 334 592 278T555 155T483 38T377 -11Q297 -11 267 66Q266 68 260 61Q201 -11 125 -11Q15 -11 15 139Q15 230 56 325T123 434Q135 441 147 436Q160 429 160 418Q160 406 140 379T94 306T62 208Q61 202 61 187Q61 124 85 100T143 76Q201 76 245 129L253 137V156Q258 297 317 297Q348 297 348 261Q348 243 338 213T318 158L308 135Q309 133 310 129T318 115T334 97T358 83T393 76Q456 76 501 148T546 274Q546 305 533 325T508 357T495 384Z"></path></g><g data-mml-node="mn" transform="translate(622, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(5297.4, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(5880.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(6269.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(6714.3, 0)"><path data-c="63" d="M370 305T349 305T313 320T297 358Q297 381 312 396Q317 401 317 402T307 404Q281 408 258 408Q209 408 178 376Q131 329 131 219Q131 137 162 90Q203 29 272 29Q313 29 338 55T374 117Q376 125 379 127T395 129H409Q415 123 415 120Q415 116 411 104T395 71T366 33T318 2T249 -11Q163 -11 99 53T34 214Q34 318 99 383T250 448T370 421T404 357Q404 334 387 320Z"></path><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z" transform="translate(444, 0)"></path><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z" transform="translate(944, 0)"></path></g><g data-mml-node="mo" transform="translate(8052.3, 0)"><path data-c="2061" d=""></path></g><g data-mml-node="mo" transform="translate(8052.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(8441.3, 0)"><g data-mml-node="mi"><path data-c="3C9" d="M495 384Q495 406 514 424T555 443Q574 443 589 425T604 364Q604 334 592 278T555 155T483 38T377 -11Q297 -11 267 66Q266 68 260 61Q201 -11 125 -11Q15 -11 15 139Q15 230 56 325T123 434Q135 441 147 436Q160 429 160 418Q160 406 140 379T94 306T62 208Q61 202 61 187Q61 124 85 100T143 76Q201 76 245 129L253 137V156Q258 297 317 297Q348 297 348 261Q348 243 338 213T318 158L308 135Q309 133 310 129T318 115T334 97T358 83T393 76Q456 76 501 148T546 274Q546 305 533 325T508 357T495 384Z"></path></g><g data-mml-node="mn" transform="translate(622, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(9466.9, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(10050.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(10439.2, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mo" transform="translate(10883.9, 0)"><path data-c="2026" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60ZM525 60Q525 84 542 102T585 120Q609 120 627 104T646 61Q646 36 629 18T586 0T543 17T525 60ZM972 60Q972 84 989 102T1032 120Q1056 120 1074 104T1093 61Q1093 36 1076 18T1033 0T990 17T972 60Z"></path></g><g data-mml-node="mo" transform="translate(12222.5, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(12667.2, 0)"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z" transform="translate(394, 0)"></path><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(672, 0)"></path></g><g data-mml-node="mo" transform="translate(13895.2, 0)"><path data-c="2061" d=""></path></g><g data-mml-node="mo" transform="translate(13895.2, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(14284.2, 0)"><g data-mml-node="mi"><path data-c="3C9" d="M495 384Q495 406 514 424T555 443Q574 443 589 425T604 364Q604 334 592 278T555 155T483 38T377 -11Q297 -11 267 66Q266 68 260 61Q201 -11 125 -11Q15 -11 15 139Q15 230 56 325T123 434Q135 441 147 436Q160 429 160 418Q160 406 140 379T94 306T62 208Q61 202 61 187Q61 124 85 100T143 76Q201 76 245 129L253 137V156Q258 297 317 297Q348 297 348 261Q348 243 338 213T318 158L308 135Q309 133 310 129T318 115T334 97T358 83T393 76Q456 76 501 148T546 274Q546 305 533 325T508 357T495 384Z"></path></g><g data-mml-node="mi" transform="translate(622, -150) scale(0.707)"><path data-c="4B" d="M285 628Q285 635 228 637Q205 637 198 638T191 647Q191 649 193 661Q199 681 203 682Q205 683 214 683H219Q260 681 355 681Q389 681 418 681T463 682T483 682Q500 682 500 674Q500 669 497 660Q496 658 496 654T495 648T493 644T490 641T486 639T479 638T470 637T456 637Q416 636 405 634T387 623L306 305Q307 305 490 449T678 597Q692 611 692 620Q692 635 667 637Q651 637 651 648Q651 650 654 662T659 677Q662 682 676 682Q680 682 711 681T791 680Q814 680 839 681T869 682Q889 682 889 672Q889 650 881 642Q878 637 862 637Q787 632 726 586Q710 576 656 534T556 455L509 418L518 396Q527 374 546 329T581 244Q656 67 661 61Q663 59 666 57Q680 47 717 46H738Q744 38 744 37T741 19Q737 6 731 0H720Q680 3 625 3Q503 3 488 0H478Q472 6 472 9T474 27Q478 40 480 43T491 46H494Q544 46 544 71Q544 75 517 141T485 216L427 354L359 301L291 248L268 155Q245 63 245 58Q245 51 253 49T303 46H334Q340 37 340 35Q340 19 333 5Q328 0 317 0Q314 0 280 1T180 2Q118 2 85 2T49 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(15584.8, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(16168.1, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(16557.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(17001.8, 0)"><path data-c="63" d="M370 305T349 305T313 320T297 358Q297 381 312 396Q317 401 317 402T307 404Q281 408 258 408Q209 408 178 376Q131 329 131 219Q131 137 162 90Q203 29 272 29Q313 29 338 55T374 117Q376 125 379 127T395 129H409Q415 123 415 120Q415 116 411 104T395 71T366 33T318 2T249 -11Q163 -11 99 53T34 214Q34 318 99 383T250 448T370 421T404 357Q404 334 387 320Z"></path><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z" transform="translate(444, 0)"></path><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z" transform="translate(944, 0)"></path></g><g data-mml-node="mo" transform="translate(18339.8, 0)"><path data-c="2061" d=""></path></g><g data-mml-node="mo" transform="translate(18339.8, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(18728.8, 0)"><g data-mml-node="mi"><path data-c="3C9" d="M495 384Q495 406 514 424T555 443Q574 443 589 425T604 364Q604 334 592 278T555 155T483 38T377 -11Q297 -11 267 66Q266 68 260 61Q201 -11 125 -11Q15 -11 15 139Q15 230 56 325T123 434Q135 441 147 436Q160 429 160 418Q160 406 140 379T94 306T62 208Q61 202 61 187Q61 124 85 100T143 76Q201 76 245 129L253 137V156Q258 297 317 297Q348 297 348 261Q348 243 338 213T318 158L308 135Q309 133 310 129T318 115T334 97T358 83T393 76Q456 76 501 148T546 274Q546 305 533 325T508 357T495 384Z"></path></g><g data-mml-node="mi" transform="translate(622, -150) scale(0.707)"><path data-c="4B" d="M285 628Q285 635 228 637Q205 637 198 638T191 647Q191 649 193 661Q199 681 203 682Q205 683 214 683H219Q260 681 355 681Q389 681 418 681T463 682T483 682Q500 682 500 674Q500 669 497 660Q496 658 496 654T495 648T493 644T490 641T486 639T479 638T470 637T456 637Q416 636 405 634T387 623L306 305Q307 305 490 449T678 597Q692 611 692 620Q692 635 667 637Q651 637 651 648Q651 650 654 662T659 677Q662 682 676 682Q680 682 711 681T791 680Q814 680 839 681T869 682Q889 682 889 672Q889 650 881 642Q878 637 862 637Q787 632 726 586Q710 576 656 534T556 455L509 418L518 396Q527 374 546 329T581 244Q656 67 661 61Q663 59 666 57Q680 47 717 46H738Q744 38 744 37T741 19Q737 6 731 0H720Q680 3 625 3Q503 3 488 0H478Q472 6 472 9T474 27Q478 40 480 43T491 46H494Q544 46 544 71Q544 75 517 141T485 216L427 354L359 301L291 248L268 155Q245 63 245 58Q245 51 253 49T303 46H334Q340 37 340 35Q340 19 333 5Q328 0 317 0Q314 0 280 1T180 2Q118 2 85 2T49 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(20029.4, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(20612.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(21001.7, 0)"><path data-c="5D" d="M22 710V750H159V-250H22V-210H119V710H22Z"></path></g><g data-mml-node="mo" transform="translate(21279.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">该时间嵌入被广播到空间维度，并与编码器特征进行融合：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{H}_t(x,y)=[\mathbf{z}_τ(x,y),e_t].
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 10298.2 1068.2" aria-hidden="true" style="max-width: 300%;vertical-align: -0.72ex;width: 23.299ex;height: 2.417ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="48" d="M400 0Q376 3 226 3Q75 3 51 0H39V62H147V624H39V686H51Q75 683 226 683Q376 683 400 686H412V624H304V388H595V624H487V686H499Q523 683 673 683Q824 683 848 686H860V624H752V62H860V0H848Q824 3 674 3Q523 3 499 0H487V62H595V326H304V62H412V0H400Z"></path></g></g><g data-mml-node="mi" transform="translate(900, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1205.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1594.3, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(2166.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(2610.9, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(3100.9, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(3767.7, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(4823.5, 0)"><path data-c="5B" d="M118 -250V750H255V710H158V-210H255V-250H118Z"></path></g><g data-mml-node="msub" transform="translate(5101.5, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="7A" d="M48 262Q48 264 54 349T60 436V444H252Q289 444 336 444T394 445Q441 445 450 441T459 418Q459 406 458 404Q456 399 327 229T194 55H237Q260 56 268 56T297 58T325 65T348 77T370 98T384 128T395 170Q400 197 400 216Q400 217 431 217H462V211Q461 208 453 108T444 6V0H245Q46 0 43 2Q32 7 32 28V33Q32 41 40 52T84 112Q129 170 164 217L298 393H256Q189 392 165 380Q124 360 115 303Q110 280 110 256Q110 254 79 254H48V262Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(511, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(6241.6, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(6630.6, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(7202.6, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(7647.3, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(8137.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(8526.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(8970.9, 0)"><g data-mml-node="mi"><path data-c="65" d="M39 168Q39 225 58 272T107 350T174 402T244 433T307 442H310Q355 442 388 420T421 355Q421 265 310 237Q261 224 176 223Q139 223 138 221Q138 219 132 186T125 128Q125 81 146 54T209 26T302 45T394 111Q403 121 406 121Q410 121 419 112T429 98T420 82T390 55T344 24T281 -1T205 -11Q126 -11 83 42T39 168ZM373 353Q367 405 305 405Q272 405 244 391T199 357T170 316T154 280T149 261Q149 260 169 260Q282 260 327 284T373 353Z"></path></g><g data-mml-node="mi" transform="translate(466, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(9742.2, 0)"><path data-c="5D" d="M22 710V750H159V-250H22V-210H119V710H22Z"></path></g><g data-mml-node="mo" transform="translate(10020.2, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从函数角度看，ITE 等价于学习一个连续时间隐式场：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="ϕ:\mathrm{ℝ}→\mathrm{ℝ}^d,e_t=ϕ(\tilde{t}).
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -903.7 9323.6 1153.7" aria-hidden="true" style="max-width: 300%;vertical-align: -0.566ex;width: 21.094ex;height: 2.61ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϕ</tspan></text></g></g><g data-mml-node="mo" transform="translate(719.8, 0)"><path data-c="3A" d="M78 370Q78 394 95 412T138 430Q162 430 180 414T199 371Q199 346 182 328T139 310T96 327T78 370ZM78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1275.6, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="211D" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g></g><g data-mml-node="mo" transform="translate(2275.3, 0)"><path data-c="2192" d="M56 237T56 250T70 270H835Q719 357 692 493Q692 494 692 496T691 499Q691 511 708 511H711Q720 511 723 510T729 506T732 497T735 481T743 456Q765 389 816 336T935 261Q944 258 944 250Q944 244 939 241T915 231T877 212Q836 186 806 152T761 85T740 35T732 4Q730 -6 727 -8T711 -11Q691 -11 691 0Q691 7 696 25Q728 151 835 230H70Q56 237 56 250Z"></path></g><g data-mml-node="msup" transform="translate(3553.1, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="211D" d="M17 665Q17 672 28 683H221Q415 681 439 677Q461 673 481 667T516 654T544 639T566 623T584 607T597 592T607 578T614 565T618 554L621 548Q626 530 626 497Q626 447 613 419Q578 348 473 326L455 321Q462 310 473 292T517 226T578 141T637 72T686 35Q705 30 705 16Q705 7 693 -1H510Q503 6 404 159L306 310H268V183Q270 67 271 59Q274 42 291 38Q295 37 319 35Q344 35 353 28Q362 17 353 3L346 -1H28Q16 5 16 16Q16 35 55 35Q96 38 101 52Q106 60 106 341T101 632Q95 645 55 648Q17 648 17 665ZM241 35Q238 42 237 45T235 78T233 163T233 337V621L237 635L244 648H133Q136 641 137 638T139 603T141 517T141 341Q141 131 140 89T134 37Q133 36 133 35H241ZM457 496Q457 540 449 570T425 615T400 634T377 643Q374 643 339 648Q300 648 281 635Q271 628 270 610T268 481V346H284Q327 346 375 352Q421 364 439 392T457 496ZM492 537T492 496T488 427T478 389T469 371T464 361Q464 360 465 360Q469 360 497 370Q593 400 593 495Q593 592 477 630L457 637L461 626Q474 611 488 561Q492 537 492 496ZM464 243Q411 317 410 317Q404 317 401 315Q384 315 370 312H346L526 35H619L606 50Q553 109 464 243Z"></path></g></g></g><g data-mml-node="mi" transform="translate(722, 413) scale(0.707)"><path data-c="64" d="M366 683Q367 683 438 688T511 694Q523 694 523 686Q523 679 450 384T375 83T374 68Q374 26 402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487H491Q506 153 506 145Q506 140 503 129Q490 79 473 48T445 8T417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157Q33 205 53 255T101 341Q148 398 195 420T280 442Q336 442 364 400Q369 394 369 396Q370 400 396 505T424 616Q424 629 417 632T378 637H357Q351 643 351 645T353 664Q358 683 366 683ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g></g><g data-mml-node="mo" transform="translate(4692.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(5137.5, 0)"><g data-mml-node="mi"><path data-c="65" d="M39 168Q39 225 58 272T107 350T174 402T244 433T307 442H310Q355 442 388 420T421 355Q421 265 310 237Q261 224 176 223Q139 223 138 221Q138 219 132 186T125 128Q125 81 146 54T209 26T302 45T394 111Q403 121 406 121Q410 121 419 112T429 98T420 82T390 55T344 24T281 -1T205 -11Q126 -11 83 42T39 168ZM373 353Q367 405 305 405Q272 405 244 391T199 357T170 316T154 280T149 261Q149 260 169 260Q282 260 327 284T373 353Z"></path></g><g data-mml-node="mi" transform="translate(466, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(6186.5, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(7242.3, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϕ</tspan></text></g></g><g data-mml-node="mo" transform="translate(7684.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(8073.3, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(8656.6, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(9045.6, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">由于 </span><span style="cursor:pointer;" data-formula="ϕ"><span data-formula="ϕ"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 442 950" aria-hidden="true" style="vertical-align: -0.452ex;width: 1ex;height: 2.149ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϕ</tspan></text></g></g></g></g><g></g></svg></span></span><span leaf=""> 是可微函数，因此其时间导数：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{v}_t=\mathrm{∇}_t ϕ(\tilde{t})
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -889 5187.4 1139" aria-hidden="true" style="max-width: 300%;vertical-align: -0.566ex;width: 11.736ex;height: 2.577ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="76" d="M401 444Q413 441 495 441Q568 441 574 444H580V382H510L409 156Q348 18 339 6Q331 -4 320 -4Q318 -4 313 -4T303 -3H288Q273 -3 264 12T221 102Q206 135 197 156L96 382H26V444H34Q49 441 145 441Q252 441 270 444H279V382H231L284 264Q335 149 338 149Q338 150 389 264T442 381Q442 382 418 382H394V444H401Z"></path></g></g><g data-mml-node="mi" transform="translate(607, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1190, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msub" transform="translate(2245.8, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2207" d="M46 676Q46 679 51 683H781Q786 679 786 676Q786 674 617 326T444 -26Q439 -33 416 -33T388 -26Q385 -22 216 326T46 676ZM697 596Q697 597 445 597T193 596Q195 591 319 336T445 80L697 596Z"></path></g></g></g><g data-mml-node="mi" transform="translate(833, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3384.1, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϕ</tspan></text></g></g><g data-mml-node="mo" transform="translate(3826.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(4215.1, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(69.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(83.3, 471)"><path data-c="7E" d="M179 251Q164 251 151 245T131 234T111 215L97 227L83 238Q83 239 95 253T121 283T142 304Q165 318 187 318T253 300T320 282Q335 282 348 288T368 299T388 318L402 306L416 295Q375 236 344 222Q330 215 313 215Q292 215 248 233T179 251Z"></path></g></g></g><g data-mml-node="mo" transform="translate(4798.4, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">可以被理解为一种隐式运动趋势描述符。相比显式光流估计，这种方式并不直接依赖噪声图像梯度，而是通过连续时间嵌入学习跨帧动态关系，因此在强噪声和复杂运动条件下具有更好的鲁棒性。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">此外，SINF 采用前向编码器 </span><span style="cursor:pointer;" data-formula="F_f"><span data-formula="F_f"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -680 1081.9 975" aria-hidden="true" style="vertical-align: -0.667ex;width: 2.448ex;height: 2.206ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="46" d="M48 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H742Q749 676 749 669Q749 664 736 557T722 447Q720 440 702 440H690Q683 445 683 453Q683 454 686 477T689 530Q689 560 682 579T663 610T626 626T575 633T503 634H480Q398 633 393 631Q388 629 386 623Q385 622 352 492L320 363H375Q378 363 398 363T426 364T448 367T472 374T489 386Q502 398 511 419T524 457T529 475Q532 480 548 480H560Q567 475 567 470Q567 467 536 339T502 207Q500 200 482 200H470Q463 206 463 212Q463 215 468 234T473 274Q473 303 453 310T364 317H309L277 190Q245 66 245 60Q245 46 334 46H359Q365 40 365 39T363 19Q359 6 353 0H336Q295 2 185 2Q120 2 86 2T48 1Z"></path></g><g data-mml-node="mi" transform="translate(643, -150) scale(0.707)"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 和后向编码器 </span><span style="cursor:pointer;" data-formula="F_b"><span data-formula="F_b"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -680 996.3 837.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 2.254ex;height: 1.895ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="46" d="M48 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H742Q749 676 749 669Q749 664 736 557T722 447Q720 440 702 440H690Q683 445 683 453Q683 454 686 477T689 530Q689 560 682 579T663 610T626 626T575 633T503 634H480Q398 633 393 631Q388 629 386 623Q385 622 352 492L320 363H375Q378 363 398 363T426 364T448 367T472 374T489 386Q502 398 511 419T524 457T529 475Q532 480 548 480H560Q567 475 567 470Q567 467 536 339T502 207Q500 200 482 200H470Q463 206 463 212Q463 215 468 234T473 274Q473 303 453 310T364 317H309L277 190Q245 66 245 60Q245 46 334 46H359Q365 40 365 39T363 19Q359 6 353 0H336Q295 2 185 2Q120 2 86 2T48 1Z"></path></g><g data-mml-node="mi" transform="translate(643, -150) scale(0.707)"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 进行双向传播，将过去帧和未来帧的信息共同用于当前帧恢复：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{H}_t=F_f(I^{\mathcal{(M)}}_t,\mathrm{ITE}(t))⊕F_b(I^{\mathcal{(M)}}_t,\mathrm{ITE}(t)).
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1060.7 18610.5 1355.7" aria-hidden="true" style="max-width: 300%;vertical-align: -0.667ex;width: 42.105ex;height: 3.067ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="48" d="M400 0Q376 3 226 3Q75 3 51 0H39V62H147V624H39V686H51Q75 683 226 683Q376 683 400 686H412V624H304V388H595V624H487V686H499Q523 683 673 683Q824 683 848 686H860V624H752V62H860V0H848Q824 3 674 3Q523 3 499 0H487V62H595V326H304V62H412V0H400Z"></path></g></g><g data-mml-node="mi" transform="translate(900, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1483, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msub" transform="translate(2538.8, 0)"><g data-mml-node="mi"><path data-c="46" d="M48 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H742Q749 676 749 669Q749 664 736 557T722 447Q720 440 702 440H690Q683 445 683 453Q683 454 686 477T689 530Q689 560 682 579T663 610T626 626T575 633T503 634H480Q398 633 393 631Q388 629 386 623Q385 622 352 492L320 363H375Q378 363 398 363T426 364T448 367T472 374T489 386Q502 398 511 419T524 457T529 475Q532 480 548 480H560Q567 475 567 470Q567 467 536 339T502 207Q500 200 482 200H470Q463 206 463 212Q463 215 468 234T473 274Q473 303 453 310T364 317H309L277 190Q245 66 245 60Q245 46 334 46H359Q365 40 365 39T363 19Q359 6 353 0H336Q295 2 185 2Q120 2 86 2T48 1Z"></path></g><g data-mml-node="mi" transform="translate(643, -150) scale(0.707)"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g></g><g data-mml-node="mo" transform="translate(3620.7, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msubsup" transform="translate(4009.7, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="TeXAtom" transform="translate(566.8, 530.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="28" d="M241 -250Q203 -212 174 -140T144 39Q144 158 180 288T296 544T481 746L487 750H499Q517 750 517 740Q517 736 495 716Q399 630 331 491T236 228T208 3Q208 -73 224 -130T255 -214T271 -244Q271 -250 252 -250H241Z"></path></g><g data-mml-node="mi" transform="translate(517, 0)"><path data-c="4D" d="M28 9Q28 37 43 63T73 90Q77 90 83 84T103 70T141 57H146Q162 57 178 79T222 167Q266 279 295 371T334 513T349 598T358 651T371 677Q397 705 432 705Q442 705 445 699T452 666Q453 661 453 659Q475 538 509 405T568 207L574 192Q581 178 587 164T594 150Q596 150 635 189T693 248Q765 324 863 438T1024 626T1089 701Q1093 705 1100 705Q1111 705 1111 682Q1111 675 1108 660T1099 611T1086 540Q1041 277 1041 144Q1041 98 1044 75T1050 48T1059 42Q1064 41 1075 46Q1102 61 1121 61Q1137 61 1137 50Q1137 28 1087 0T1000 -29Q983 -29 972 -23T955 -9T945 16T942 45T941 83V96Q941 158 952 256T974 422L985 489Q984 489 939 436T821 300T698 164Q665 128 620 85T568 37Q564 34 558 34Q550 34 546 37T535 54Q512 91 496 127T450 259T389 498L384 518Q349 367 294 223T198 15Q155 -50 117 -50Q87 -50 61 -35T30 -6Q28 2 28 9Z"></path></g><g data-mml-node="mo" transform="translate(1718, 0)"><path data-c="29" d="M326 497Q326 546 320 588T304 655T285 699T269 728T262 740Q262 746 267 749L272 750Q276 750 281 750H293Q331 712 360 640T390 461Q390 332 339 171T188 -116Q161 -150 121 -188T47 -250H35Q17 -250 17 -240Q17 -236 39 -216Q135 -130 203 9T298 272T326 497Z"></path></g></g></g><g data-mml-node="mi" transform="translate(440, -269) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(6130.5, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(6575.2, 0)"><g data-mml-node="mi"><path data-c="49" d="M328 0Q307 3 180 3T32 0H21V46H43Q92 46 106 49T126 60Q128 63 128 342Q128 620 126 623Q122 628 118 630T96 635T43 637H21V683H32Q53 680 180 680T328 683H339V637H317Q268 637 254 634T234 623Q232 620 232 342Q232 63 234 60Q238 55 242 53T264 48T317 46H339V0H328Z"></path></g><g data-mml-node="mi" transform="translate(361, 0)"><path data-c="54" d="M36 443Q37 448 46 558T55 671V677H666V671Q667 666 676 556T685 443V437H645V443Q645 445 642 478T631 544T610 593Q593 614 555 625Q534 630 478 630H451H443Q417 630 414 618Q413 616 413 339V63Q420 53 439 50T528 46H558V0H545L361 3Q186 1 177 0H164V46H194Q264 46 283 49T309 63V339V550Q309 620 304 625T271 630H244H224Q154 630 119 601Q101 585 93 554T81 486T76 443V437H36V443Z"></path></g><g data-mml-node="mi" transform="translate(1083, 0)"><path data-c="45" d="M128 619Q121 626 117 628T101 631T58 634H25V680H597V676Q599 670 611 560T625 444V440H585V444Q584 447 582 465Q578 500 570 526T553 571T528 601T498 619T457 629T411 633T353 634Q266 634 251 633T233 622Q233 622 233 621Q232 619 232 497V376H286Q359 378 377 385Q413 401 416 469Q416 471 416 473V493H456V213H416V233Q415 268 408 288T383 317T349 328T297 330Q290 330 286 330H232V196V114Q232 57 237 52Q243 47 289 47H340H391Q428 47 452 50T505 62T552 92T584 146Q594 172 599 200T607 247T612 270V273H652V270Q651 267 632 137T610 3V0H25V46H58Q100 47 109 49T128 61V619Z"></path></g></g><g data-mml-node="mo" transform="translate(8339.2, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(8728.2, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(9089.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(9478.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(10089.4, 0)"><path data-c="2295" d="M56 250Q56 394 156 488T384 583Q530 583 626 485T722 250Q722 110 625 14T390 -83Q249 -83 153 14T56 250ZM364 542Q308 539 251 509T148 418T96 278V270H369V542H364ZM681 278Q675 338 650 386T592 462T522 509T458 535T412 542H409V270H681V278ZM96 222Q104 150 139 95T219 12T302 -29T366 -42H369V230H96V222ZM681 222V230H409V-42H412Q429 -42 456 -36T521 -10T590 37T649 113T681 222Z"></path></g><g data-mml-node="msub" transform="translate(11089.7, 0)"><g data-mml-node="mi"><path data-c="46" d="M48 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H742Q749 676 749 669Q749 664 736 557T722 447Q720 440 702 440H690Q683 445 683 453Q683 454 686 477T689 530Q689 560 682 579T663 610T626 626T575 633T503 634H480Q398 633 393 631Q388 629 386 623Q385 622 352 492L320 363H375Q378 363 398 363T426 364T448 367T472 374T489 386Q502 398 511 419T524 457T529 475Q532 480 548 480H560Q567 475 567 470Q567 467 536 339T502 207Q500 200 482 200H470Q463 206 463 212Q463 215 468 234T473 274Q473 303 453 310T364 317H309L277 190Q245 66 245 60Q245 46 334 46H359Q365 40 365 39T363 19Q359 6 353 0H336Q295 2 185 2Q120 2 86 2T48 1Z"></path></g><g data-mml-node="mi" transform="translate(643, -150) scale(0.707)"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g></g><g data-mml-node="mo" transform="translate(12086, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msubsup" transform="translate(12475, 0)"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="TeXAtom" transform="translate(566.8, 530.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="28" d="M241 -250Q203 -212 174 -140T144 39Q144 158 180 288T296 544T481 746L487 750H499Q517 750 517 740Q517 736 495 716Q399 630 331 491T236 228T208 3Q208 -73 224 -130T255 -214T271 -244Q271 -250 252 -250H241Z"></path></g><g data-mml-node="mi" transform="translate(517, 0)"><path data-c="4D" d="M28 9Q28 37 43 63T73 90Q77 90 83 84T103 70T141 57H146Q162 57 178 79T222 167Q266 279 295 371T334 513T349 598T358 651T371 677Q397 705 432 705Q442 705 445 699T452 666Q453 661 453 659Q475 538 509 405T568 207L574 192Q581 178 587 164T594 150Q596 150 635 189T693 248Q765 324 863 438T1024 626T1089 701Q1093 705 1100 705Q1111 705 1111 682Q1111 675 1108 660T1099 611T1086 540Q1041 277 1041 144Q1041 98 1044 75T1050 48T1059 42Q1064 41 1075 46Q1102 61 1121 61Q1137 61 1137 50Q1137 28 1087 0T1000 -29Q983 -29 972 -23T955 -9T945 16T942 45T941 83V96Q941 158 952 256T974 422L985 489Q984 489 939 436T821 300T698 164Q665 128 620 85T568 37Q564 34 558 34Q550 34 546 37T535 54Q512 91 496 127T450 259T389 498L384 518Q349 367 294 223T198 15Q155 -50 117 -50Q87 -50 61 -35T30 -6Q28 2 28 9Z"></path></g><g data-mml-node="mo" transform="translate(1718, 0)"><path data-c="29" d="M326 497Q326 546 320 588T304 655T285 699T269 728T262 740Q262 746 267 749L272 750Q276 750 281 750H293Q331 712 360 640T390 461Q390 332 339 171T188 -116Q161 -150 121 -188T47 -250H35Q17 -250 17 -240Q17 -236 39 -216Q135 -130 203 9T298 272T326 497Z"></path></g></g></g><g data-mml-node="mi" transform="translate(440, -269) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(14595.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(15040.5, 0)"><g data-mml-node="mi"><path data-c="49" d="M328 0Q307 3 180 3T32 0H21V46H43Q92 46 106 49T126 60Q128 63 128 342Q128 620 126 623Q122 628 118 630T96 635T43 637H21V683H32Q53 680 180 680T328 683H339V637H317Q268 637 254 634T234 623Q232 620 232 342Q232 63 234 60Q238 55 242 53T264 48T317 46H339V0H328Z"></path></g><g data-mml-node="mi" transform="translate(361, 0)"><path data-c="54" d="M36 443Q37 448 46 558T55 671V677H666V671Q667 666 676 556T685 443V437H645V443Q645 445 642 478T631 544T610 593Q593 614 555 625Q534 630 478 630H451H443Q417 630 414 618Q413 616 413 339V63Q420 53 439 50T528 46H558V0H545L361 3Q186 1 177 0H164V46H194Q264 46 283 49T309 63V339V550Q309 620 304 625T271 630H244H224Q154 630 119 601Q101 585 93 554T81 486T76 443V437H36V443Z"></path></g><g data-mml-node="mi" transform="translate(1083, 0)"><path data-c="45" d="M128 619Q121 626 117 628T101 631T58 634H25V680H597V676Q599 670 611 560T625 444V440H585V444Q584 447 582 465Q578 500 570 526T553 571T528 601T498 619T457 629T411 633T353 634Q266 634 251 633T233 622Q233 622 233 621Q232 619 232 497V376H286Q359 378 377 385Q413 401 416 469Q416 471 416 473V493H456V213H416V233Q415 268 408 288T383 317T349 328T297 330Q290 330 286 330H232V196V114Q232 57 237 52Q243 47 289 47H340H391Q428 47 452 50T505 62T552 92T584 146Q594 172 599 200T607 247T612 270V273H652V270Q651 267 632 137T610 3V0H25V46H58Q100 47 109 49T128 61V619Z"></path></g></g><g data-mml-node="mo" transform="translate(16804.5, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(17193.5, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(17554.5, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(17943.5, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(18332.5, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种双向结构增强了时间上下文表达，使模型不仅能利用前序信息，也能利用后续信息，从而更好地恢复动态场景中的连续结构。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">时序感知图：Time-Aware Spatial Graph Module</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">复杂运动场景中的跨帧对齐仍然是视频恢复的关键问题。传统方法通常通过光流实现像素级配准，但光流对噪声敏感，且在遮挡、非刚性运动和低纹理区域容易失效。为此，论文提出 Time-Aware Spatial Graph Module（TSGM），通过时间感知图注意力机制实现更鲁棒的跨帧对齐与融合。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="TSGM示意图" class="rich_pages wxw-img" data-ratio="0.8296296296296296" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175732" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=20299b50&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8EmJibGI3GfTGshop4ULUJ43EquxibguCB0e68hCFIGzM1c2UyKmTVw8iaxADXShP2W1dpbicXgAJxPAMBEaBibKL7icspVOJTlr5IA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">TSGM示意图</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">TSGM 包含两个相互关联的阶段：时间对齐和空间对齐。在时间对齐阶段，模型将归一化时间坐标映射为多频率时间描述符，并注入每个像素特征：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{U}_τ(x,y)=\mathbf{H}_τ(x,y)+\mathbf{B} ϕ_τ.
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 12335.7 1126.8" aria-hidden="true" style="max-width: 300%;vertical-align: -0.852ex;width: 27.909ex;height: 2.549ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="55" d="M570 686Q588 683 703 683T836 686H845V624H737V420Q737 390 737 345T738 284Q738 205 729 164T689 83Q614 -11 465 -11Q321 -11 240 51T148 207Q147 214 147 421V624H39V686H51Q75 683 226 683Q376 683 400 686H412V624H304V405V370V268Q304 181 311 146T346 87Q387 52 466 52Q642 52 667 195Q668 204 669 415V624H561V686H570Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(885, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(1514.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1903.1, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(2475.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(2919.8, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(3409.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(4076.6, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msub" transform="translate(5132.3, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="48" d="M400 0Q376 3 226 3Q75 3 51 0H39V62H147V624H39V686H51Q75 683 226 683Q376 683 400 686H412V624H304V388H595V624H487V686H499Q523 683 673 683Q824 683 848 686H860V624H752V62H860V0H848Q824 3 674 3Q523 3 499 0H487V62H595V326H304V62H412V0H400Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(900, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(6661.5, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(7050.5, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(7622.5, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(8067.1, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(8557.1, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(9168.4, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(10168.6, 0)"><g data-mml-node="mi"><path data-c="42" d="M720 510Q720 476 704 448T665 404T619 377T580 362L564 359L583 356Q602 353 632 342T690 312Q712 292 725 276Q752 235 752 189V183Q752 160 741 125Q698 18 547 2Q543 1 288 0H39V62H147V624H39V686H264H409Q502 686 542 681T624 655Q720 607 720 510ZM563 513Q563 553 548 578T518 611T486 622Q479 624 385 624H293V382H375Q458 383 467 385Q563 405 563 513ZM590 192Q590 307 505 329Q504 330 503 330L398 331H293V62H391H400H444Q496 62 528 75T580 131Q590 155 590 192Z"></path></g></g><g data-mml-node="msub" transform="translate(10986.6, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϕ</tspan></text></g></g><g data-mml-node="TeXAtom" transform="translate(442, -235.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(12057.7, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中 </span><span style="cursor:pointer;" data-formula="ϕ_τ"><span data-formula="ϕ_τ"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 1071.1 1126.8" aria-hidden="true" style="vertical-align: -0.852ex;width: 2.423ex;height: 2.549ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϕ</tspan></text></g></g><g data-mml-node="TeXAtom" transform="translate(442, -235.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 是时间嵌入， </span><span style="cursor:pointer;" data-formula="B"><span data-formula="B"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 759 683" aria-hidden="true" style="vertical-align: 0px;width: 1.717ex;height: 1.545ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="42" d="M231 637Q204 637 199 638T194 649Q194 676 205 682Q206 683 335 683Q594 683 608 681Q671 671 713 636T756 544Q756 480 698 429T565 360L555 357Q619 348 660 311T702 219Q702 146 630 78T453 1Q446 0 242 0Q42 0 39 2Q35 5 35 10Q35 17 37 24Q42 43 47 45Q51 46 62 46H68Q95 46 128 49Q142 52 147 61Q150 65 219 339T288 628Q288 635 231 637ZM649 544Q649 574 634 600T585 634Q578 636 493 637Q473 637 451 637T416 636H403Q388 635 384 626Q382 622 352 506Q352 503 351 500L320 374H401Q482 374 494 376Q554 386 601 434T649 544ZM595 229Q595 273 572 302T512 336Q506 337 429 337Q311 337 310 336Q310 334 293 263T258 122L240 52Q240 48 252 48T333 46Q422 46 429 47Q491 54 543 105T595 229Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 是可学习线性映射。为了衡量目标时间 </span><span style="cursor:pointer;" data-formula="t"><span data-formula="t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -626 361 637" aria-hidden="true" style="vertical-align: -0.025ex;width: 0.817ex;height: 1.441ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 与邻域时间 </span><span style="cursor:pointer;" data-formula="τ"><span data-formula="τ"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 819 950" aria-hidden="true" style="vertical-align: -0.452ex;width: 1.853ex;height: 2.149ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g></g><g></g></svg></span></span><span leaf=""> 的兼容性，模型计算时间相似度：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="s(τ)=\frac{⟨ϕ_t,ϕ_τ⟩}{τ_{\mathrm{temp}}},α_τ=\frac{\mathrm{exp}⁡(s(τ))}{\sum\limits_{μ≠t}{}\mathrm{exp}⁡(s(μ))}.
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1586.8 16748.1 3496.1" aria-hidden="true" style="max-width: 300%;vertical-align: -4.32ex;width: 37.892ex;height: 7.91ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="73" d="M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z"></path></g><g data-mml-node="mo" transform="translate(469, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(858, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g><g data-mml-node="mo" transform="translate(1677, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(2343.8, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mfrac" transform="translate(3399.6, 0)"><g data-mml-node="mrow" transform="translate(220, 836.8)"><g data-mml-node="mo"><path data-c="27E8" d="M333 -232Q332 -239 327 -244T313 -250Q303 -250 296 -240Q293 -233 202 6T110 250T201 494T296 740Q299 745 306 749L309 750Q312 750 313 750Q331 750 333 732Q333 727 243 489Q152 252 152 250T243 11Q333 -227 333 -232Z"></path></g><g data-mml-node="msub" transform="translate(389, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϕ</tspan></text></g></g><g data-mml-node="mi" transform="translate(442, -235.4) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1136.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(1580.9, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">ϕ</tspan></text></g></g><g data-mml-node="TeXAtom" transform="translate(442, -235.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(2652.1, 0)"><path data-c="27E9" d="M55 732Q56 739 61 744T75 750Q85 750 92 740Q95 733 186 494T278 250T187 6T92 -240Q85 -250 75 -250Q67 -250 62 -245T55 -232Q55 -227 145 11Q236 248 236 250T145 489Q55 727 55 732Z"></path></g></g><g data-mml-node="msub" transform="translate(520.4, -710)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g><g data-mml-node="TeXAtom" transform="translate(819, -235.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M27 422Q80 426 109 478T141 600V615H181V431H316V385H181V241Q182 116 182 100T189 68Q203 29 238 29Q282 29 292 100Q293 108 293 146V181H333V146V134Q333 57 291 17Q264 -10 221 -10Q187 -10 162 2T124 33T105 68T98 100Q97 107 97 248V385H18V422H27Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="65" d="M28 218Q28 273 48 318T98 391T163 433T229 448Q282 448 320 430T378 380T406 316T415 245Q415 238 408 231H126V216Q126 68 226 36Q246 30 270 30Q312 30 342 62Q359 79 369 104L379 128Q382 131 395 131H398Q415 131 415 121Q415 117 412 108Q393 53 349 21T250 -11Q155 -11 92 58T28 218ZM333 275Q322 403 238 411H236Q228 411 220 410T195 402T166 381T143 340T127 274V267H333V275Z"></path></g><g data-mml-node="mi" transform="translate(833, 0)"><path data-c="6D" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q351 442 364 440T387 434T406 426T421 417T432 406T441 395T448 384T452 374T455 366L457 361L460 365Q463 369 466 373T475 384T488 397T503 410T523 422T546 432T572 439T603 442Q729 442 740 329Q741 322 741 190V104Q741 66 743 59T754 49Q775 46 803 46H819V0H811L788 1Q764 2 737 2T699 3Q596 3 587 0H579V46H595Q656 46 656 62Q657 64 657 200Q656 335 655 343Q649 371 635 385T611 402T585 404Q540 404 506 370Q479 343 472 315T464 232V168V108Q464 78 465 68T468 55T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path></g><g data-mml-node="mi" transform="translate(1666, 0)"><path data-c="70" d="M36 -148H50Q89 -148 97 -134V-126Q97 -119 97 -107T97 -77T98 -38T98 6T98 55T98 106Q98 140 98 177T98 243T98 296T97 335T97 351Q94 370 83 376T38 385H20V408Q20 431 22 431L32 432Q42 433 61 434T98 436Q115 437 135 438T165 441T176 442H179V416L180 390L188 397Q247 441 326 441Q407 441 464 377T522 216Q522 115 457 52T310 -11Q242 -11 190 33L182 40V-45V-101Q182 -128 184 -134T195 -145Q216 -148 244 -148H260V-194H252L228 -193Q205 -192 178 -192T140 -191Q37 -191 28 -194H20V-148H36ZM424 218Q424 292 390 347T305 402Q234 402 182 337V98Q222 26 294 26Q345 26 384 80T424 218Z"></path></g></g></g></g><rect width="3241.1" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(6880.6, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(7325.3, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">α</tspan></text></g></g><g data-mml-node="TeXAtom" transform="translate(819, -235.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(9051.2, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mfrac" transform="translate(10107, 0)"><g data-mml-node="mrow" transform="translate(995.6, 710)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="65" d="M28 218Q28 273 48 318T98 391T163 433T229 448Q282 448 320 430T378 380T406 316T415 245Q415 238 408 231H126V216Q126 68 226 36Q246 30 270 30Q312 30 342 62Q359 79 369 104L379 128Q382 131 395 131H398Q415 131 415 121Q415 117 412 108Q393 53 349 21T250 -11Q155 -11 92 58T28 218ZM333 275Q322 403 238 411H236Q228 411 220 410T195 402T166 381T143 340T127 274V267H333V275Z"></path></g><g data-mml-node="mi" transform="translate(444, 0)"><path data-c="78" d="M201 0Q189 3 102 3Q26 3 17 0H11V46H25Q48 47 67 52T96 61T121 78T139 96T160 122T180 150L226 210L168 288Q159 301 149 315T133 336T122 351T113 363T107 370T100 376T94 379T88 381T80 383Q74 383 44 385H16V431H23Q59 429 126 429Q219 429 229 431H237V385Q201 381 201 369Q201 367 211 353T239 315T268 274L272 270L297 304Q329 345 329 358Q329 364 327 369T322 376T317 380T310 384L307 385H302V431H309Q324 428 408 428Q487 428 493 431H499V385H492Q443 385 411 368Q394 360 377 341T312 257L296 236L358 151Q424 61 429 57T446 50Q464 46 499 46H516V0H510H502Q494 1 482 1T457 2T432 2T414 3Q403 3 377 3T327 1L304 0H295V46H298Q309 46 320 51T331 63Q331 65 291 120L250 175Q249 174 219 133T185 88Q181 83 181 74Q181 63 188 55T206 46Q208 46 208 23V0H201Z"></path></g><g data-mml-node="mi" transform="translate(972, 0)"><path data-c="70" d="M36 -148H50Q89 -148 97 -134V-126Q97 -119 97 -107T97 -77T98 -38T98 6T98 55T98 106Q98 140 98 177T98 243T98 296T97 335T97 351Q94 370 83 376T38 385H20V408Q20 431 22 431L32 432Q42 433 61 434T98 436Q115 437 135 438T165 441T176 442H179V416L180 390L188 397Q247 441 326 441Q407 441 464 377T522 216Q522 115 457 52T310 -11Q242 -11 190 33L182 40V-45V-101Q182 -128 184 -134T195 -145Q216 -148 244 -148H260V-194H252L228 -193Q205 -192 178 -192T140 -191Q37 -191 28 -194H20V-148H36ZM424 218Q424 292 390 347T305 402Q234 402 182 337V98Q222 26 294 26Q345 26 384 80T424 218Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1528, 0)"><g data-mml-node="mo"><path data-c="2061" d=""></path></g></g><g data-mml-node="mo" transform="translate(1528, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1917, 0)"><path data-c="73" d="M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z"></path></g><g data-mml-node="mo" transform="translate(2386, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(2775, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g><g data-mml-node="mo" transform="translate(3594, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(3983, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g><g data-mml-node="mrow" transform="translate(220, -710)"><g data-mml-node="munder"><g data-mml-node="mo" transform="translate(164.3, 0)"><path data-c="2211" d="M61 748Q64 750 489 750H913L954 640Q965 609 976 579T993 533T999 516H979L959 517Q936 579 886 621T777 682Q724 700 655 705T436 710H319Q183 710 183 709Q186 706 348 484T511 259Q517 250 513 244L490 216Q466 188 420 134T330 27L149 -187Q149 -188 362 -188Q388 -188 436 -188T506 -189Q679 -189 778 -162T936 -43Q946 -27 959 6H999L913 -249L489 -250Q65 -250 62 -248Q56 -246 56 -239Q56 -234 118 -161Q186 -81 245 -11L428 206Q428 207 242 462L57 717L56 728Q56 744 61 748Z"></path></g><g data-mml-node="TeXAtom" transform="translate(0, -947.3) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">μ</tspan></text></g></g><g data-mml-node="mo" transform="translate(819, 0)"><path data-c="2260" d="M166 -215T159 -215T147 -212T141 -204T139 -197Q139 -190 144 -183L306 133H70Q56 140 56 153Q56 168 72 173H327L406 327H72Q56 332 56 347Q56 360 70 367H426Q597 702 602 707Q605 716 618 716Q625 716 630 712T636 703T638 696Q638 692 471 367H707Q722 359 722 347Q722 336 708 328L451 327L371 173H708Q722 163 722 153Q722 140 707 133H351Q175 -210 170 -212Q166 -215 159 -215Z"></path></g><g data-mml-node="mi" transform="translate(1597, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1551.2, 0)"></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1551.2, 0)"><g data-mml-node="mi"><path data-c="65" d="M28 218Q28 273 48 318T98 391T163 433T229 448Q282 448 320 430T378 380T406 316T415 245Q415 238 408 231H126V216Q126 68 226 36Q246 30 270 30Q312 30 342 62Q359 79 369 104L379 128Q382 131 395 131H398Q415 131 415 121Q415 117 412 108Q393 53 349 21T250 -11Q155 -11 92 58T28 218ZM333 275Q322 403 238 411H236Q228 411 220 410T195 402T166 381T143 340T127 274V267H333V275Z"></path></g><g data-mml-node="mi" transform="translate(444, 0)"><path data-c="78" d="M201 0Q189 3 102 3Q26 3 17 0H11V46H25Q48 47 67 52T96 61T121 78T139 96T160 122T180 150L226 210L168 288Q159 301 149 315T133 336T122 351T113 363T107 370T100 376T94 379T88 381T80 383Q74 383 44 385H16V431H23Q59 429 126 429Q219 429 229 431H237V385Q201 381 201 369Q201 367 211 353T239 315T268 274L272 270L297 304Q329 345 329 358Q329 364 327 369T322 376T317 380T310 384L307 385H302V431H309Q324 428 408 428Q487 428 493 431H499V385H492Q443 385 411 368Q394 360 377 341T312 257L296 236L358 151Q424 61 429 57T446 50Q464 46 499 46H516V0H510H502Q494 1 482 1T457 2T432 2T414 3Q403 3 377 3T327 1L304 0H295V46H298Q309 46 320 51T331 63Q331 65 291 120L250 175Q249 174 219 133T185 88Q181 83 181 74Q181 63 188 55T206 46Q208 46 208 23V0H201Z"></path></g><g data-mml-node="mi" transform="translate(972, 0)"><path data-c="70" d="M36 -148H50Q89 -148 97 -134V-126Q97 -119 97 -107T97 -77T98 -38T98 6T98 55T98 106Q98 140 98 177T98 243T98 296T97 335T97 351Q94 370 83 376T38 385H20V408Q20 431 22 431L32 432Q42 433 61 434T98 436Q115 437 135 438T165 441T176 442H179V416L180 390L188 397Q247 441 326 441Q407 441 464 377T522 216Q522 115 457 52T310 -11Q242 -11 190 33L182 40V-45V-101Q182 -128 184 -134T195 -145Q216 -148 244 -148H260V-194H252L228 -193Q205 -192 178 -192T140 -191Q37 -191 28 -194H20V-148H36ZM424 218Q424 292 390 347T305 402Q234 402 182 337V98Q222 26 294 26Q345 26 384 80T424 218Z"></path></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3079.2, 0)"><g data-mml-node="mo"><path data-c="2061" d=""></path></g></g><g data-mml-node="mo" transform="translate(3079.2, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(3468.2, 0)"><path data-c="73" d="M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z"></path></g><g data-mml-node="mo" transform="translate(3937.2, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(4326.2, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">μ</tspan></text></g></g><g data-mml-node="mo" transform="translate(5145.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(5534.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g><rect width="6123.2" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(16470.1, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这里，</span><span style="cursor:pointer;" data-formula="α_τ"><span data-formula="α_τ"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 1448.1 1126.8" aria-hidden="true" style="vertical-align: -0.852ex;width: 3.276ex;height: 2.549ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">α</tspan></text></g></g><g data-mml-node="TeXAtom" transform="translate(819, -235.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 表示时间门控权重，用于抑制时间不兼容或噪声较强的邻近帧。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在空间对齐阶段，TSGM 将每一帧划分为局部窗口，并将窗口中的 token 视为图节点。对于目标帧和邻近帧之间的局部窗口，模型计算 query、key 和 value：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{Q}^w_t=\mathbf{U}^w_t\mathbf{W}_q,\mathbf{K}^w_τ=\mathbf{U}^w_τ\mathbf{W}_k,\mathbf{V}^w_τ=\mathbf{U}^w_τ\mathbf{W}_v.
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -736.3 18839.7 1182.8" aria-hidden="true" style="max-width: 300%;vertical-align: -1.01ex;width: 42.624ex;height: 2.676ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="51" d="M64 339Q64 431 96 502T182 614T295 675T420 696Q469 696 481 695Q620 680 709 589T798 339Q798 255 768 184Q720 77 611 26L600 21Q635 -26 682 -26H696Q769 -26 769 0Q769 7 774 12T787 18Q805 18 805 -7V-13Q803 -64 785 -106T737 -171Q720 -183 697 -191Q687 -193 668 -193Q636 -193 613 -182T575 -144T552 -94T532 -27Q531 -23 530 -16T528 -6T526 -3L512 -5Q499 -7 477 -8T431 -10Q393 -10 382 -9Q238 8 151 97T64 339ZM326 80Q326 113 356 138T430 163Q492 163 542 100L553 86Q554 85 561 91T578 108Q637 179 637 330Q637 430 619 498T548 604Q500 641 425 641Q408 641 390 637T347 623T299 590T259 535Q226 469 226 338Q226 244 246 180T318 79L325 74Q326 74 326 80ZM506 58Q480 112 433 112Q412 112 395 104T378 77Q378 44 431 44Q480 44 506 58Z"></path></g></g><g data-mml-node="mi" transform="translate(864, 423.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="mi" transform="translate(864, -247) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1698.1, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msubsup" transform="translate(2753.8, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="55" d="M570 686Q588 683 703 683T836 686H845V624H737V420Q737 390 737 345T738 284Q738 205 729 164T689 83Q614 -11 465 -11Q321 -11 240 51T148 207Q147 214 147 421V624H39V686H51Q75 683 226 683Q376 683 400 686H412V624H304V405V370V268Q304 181 311 146T346 87Q387 52 466 52Q642 52 667 195Q668 204 669 415V624H561V686H570Z"></path></g></g><g data-mml-node="mi" transform="translate(885, 413.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="mi" transform="translate(885, -247) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="msub" transform="translate(4195.1, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="57" d="M915 686L1052 683Q1142 683 1157 686H1164V624H1073L957 320Q930 249 900 170T855 52T839 10Q834 0 826 -5Q821 -7 799 -7H792Q777 -7 772 -5T759 10Q759 11 748 39T716 122T676 228L594 442L512 228Q486 159 455 78Q433 19 428 9T416 -5Q411 -7 389 -7H379Q356 -7 349 10Q349 12 334 51T288 170T231 320L116 624H24V686H35Q44 683 183 683Q331 683 355 686H368V624H323Q278 624 278 623L437 207L499 369L561 531L526 624H434V686H445Q454 683 593 683Q741 683 765 686H778V624H733Q688 624 688 623L847 207Q848 207 927 415T1006 624H905V686H915Z"></path></g></g><g data-mml-node="mi" transform="translate(1189, -150) scale(0.707)"><path data-c="71" d="M33 157Q33 258 109 349T280 441Q340 441 372 389Q373 390 377 395T388 406T404 418Q438 442 450 442Q454 442 457 439T460 434Q460 425 391 149Q320 -135 320 -139Q320 -147 365 -148H390Q396 -156 396 -157T393 -175Q389 -188 383 -194H370Q339 -192 262 -192Q234 -192 211 -192T174 -192T157 -193Q143 -193 143 -185Q143 -182 145 -170Q149 -154 152 -151T172 -148Q220 -148 230 -141Q238 -136 258 -53T279 32Q279 33 272 29Q224 -10 172 -10Q117 -10 75 30T33 157ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g></g><g data-mml-node="mo" transform="translate(5759.4, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msubsup" transform="translate(6204.1, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4B" d="M400 0Q376 3 226 3Q75 3 51 0H39V62H147V624H39V686H51Q75 683 226 683Q376 683 400 686H412V624H304V338L472 483L634 624H565V686H576Q597 683 728 683Q814 683 829 686H836V624H730L614 524Q507 432 497 422Q496 422 498 418T514 395T553 342T627 241L759 63L805 62H852V0H842Q830 3 701 3Q550 3 526 0H513V62H549Q584 62 584 63Q583 65 486 196T388 328L304 256V62H412V0H400Z"></path></g></g><g data-mml-node="mi" transform="translate(901, 413.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(901, -305.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(8012, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msubsup" transform="translate(9067.7, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="55" d="M570 686Q588 683 703 683T836 686H845V624H737V420Q737 390 737 345T738 284Q738 205 729 164T689 83Q614 -11 465 -11Q321 -11 240 51T148 207Q147 214 147 421V624H39V686H51Q75 683 226 683Q376 683 400 686H412V624H304V405V370V268Q304 181 311 146T346 87Q387 52 466 52Q642 52 667 195Q668 204 669 415V624H561V686H570Z"></path></g></g><g data-mml-node="mi" transform="translate(885, 413.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(885, -305.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="msub" transform="translate(10581.9, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="57" d="M915 686L1052 683Q1142 683 1157 686H1164V624H1073L957 320Q930 249 900 170T855 52T839 10Q834 0 826 -5Q821 -7 799 -7H792Q777 -7 772 -5T759 10Q759 11 748 39T716 122T676 228L594 442L512 228Q486 159 455 78Q433 19 428 9T416 -5Q411 -7 389 -7H379Q356 -7 349 10Q349 12 334 51T288 170T231 320L116 624H24V686H35Q44 683 183 683Q331 683 355 686H368V624H323Q278 624 278 623L437 207L499 369L561 531L526 624H434V686H445Q454 683 593 683Q741 683 765 686H778V624H733Q688 624 688 623L847 207Q848 207 927 415T1006 624H905V686H915Z"></path></g></g><g data-mml-node="mi" transform="translate(1189, -150) scale(0.707)"><path data-c="6B" d="M121 647Q121 657 125 670T137 683Q138 683 209 688T282 694Q294 694 294 686Q294 679 244 477Q194 279 194 272Q213 282 223 291Q247 309 292 354T362 415Q402 442 438 442Q468 442 485 423T503 369Q503 344 496 327T477 302T456 291T438 288Q418 288 406 299T394 328Q394 353 410 369T442 390L458 393Q446 405 434 405H430Q398 402 367 380T294 316T228 255Q230 254 243 252T267 246T293 238T320 224T342 206T359 180T365 147Q365 130 360 106T354 66Q354 26 381 26Q429 26 459 145Q461 153 479 153H483Q499 153 499 144Q499 139 496 130Q455 -11 378 -11Q333 -11 305 15T277 90Q277 108 280 121T283 145Q283 167 269 183T234 206T200 217T182 220H180Q168 178 159 139T145 81T136 44T129 20T122 7T111 -2Q98 -11 83 -11Q66 -11 57 -1T48 16Q48 26 85 176T158 471L195 616Q196 629 188 632T149 637H144Q134 637 131 637T124 640T121 647Z"></path></g></g><g data-mml-node="mo" transform="translate(12189.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msubsup" transform="translate(12633.9, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="56" d="M592 686H604Q615 685 631 685T666 684T700 684T724 683Q829 683 835 686H843V624H744L611 315Q584 254 546 165Q492 40 482 19T461 -6L460 -7H409Q398 -4 391 9Q385 20 257 315L124 624H25V686H36Q57 683 190 683Q340 683 364 686H377V624H289L384 403L480 185L492 212Q504 240 529 298T575 405L670 624H582V686H592Z"></path></g></g><g data-mml-node="mi" transform="translate(869, 413.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(869, -305.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(14409.8, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msubsup" transform="translate(15465.6, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="55" d="M570 686Q588 683 703 683T836 686H845V624H737V420Q737 390 737 345T738 284Q738 205 729 164T689 83Q614 -11 465 -11Q321 -11 240 51T148 207Q147 214 147 421V624H39V686H51Q75 683 226 683Q376 683 400 686H412V624H304V405V370V268Q304 181 311 146T346 87Q387 52 466 52Q642 52 667 195Q668 204 669 415V624H561V686H570Z"></path></g></g><g data-mml-node="mi" transform="translate(885, 413.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(885, -305.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="msub" transform="translate(16979.7, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="57" d="M915 686L1052 683Q1142 683 1157 686H1164V624H1073L957 320Q930 249 900 170T855 52T839 10Q834 0 826 -5Q821 -7 799 -7H792Q777 -7 772 -5T759 10Q759 11 748 39T716 122T676 228L594 442L512 228Q486 159 455 78Q433 19 428 9T416 -5Q411 -7 389 -7H379Q356 -7 349 10Q349 12 334 51T288 170T231 320L116 624H24V686H35Q44 683 183 683Q331 683 355 686H368V624H323Q278 624 278 623L437 207L499 369L561 531L526 624H434V686H445Q454 683 593 683Q741 683 765 686H778V624H733Q688 624 688 623L847 207Q848 207 927 415T1006 624H905V686H915Z"></path></g></g><g data-mml-node="mi" transform="translate(1189, -150) scale(0.707)"><path data-c="76" d="M173 380Q173 405 154 405Q130 405 104 376T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Q21 294 29 316T53 368T97 419T160 441Q202 441 225 417T249 361Q249 344 246 335Q246 329 231 291T200 202T182 113Q182 86 187 69Q200 26 250 26Q287 26 319 60T369 139T398 222T409 277Q409 300 401 317T383 343T365 361T357 383Q357 405 376 424T417 443Q436 443 451 425T467 367Q467 340 455 284T418 159T347 40T241 -11Q177 -11 139 22Q102 54 102 117Q102 148 110 181T151 298Q173 362 173 380Z"></path></g></g><g data-mml-node="mo" transform="translate(18561.7, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">跨帧图注意力权重为：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{A}^w_{t←τ}=\mathrm{softmax}(\frac{\mathbf{Q}^w_t(\mathbf{K}^w_τ)^T}{\sqrt{d_q}}+β\mathbf{M}^w_{t←τ}).
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1748.2 17807.2 2968.2" aria-hidden="true" style="max-width: 300%;vertical-align: -2.76ex;width: 40.288ex;height: 6.715ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="41" d="M296 0Q278 3 164 3Q58 3 49 0H40V62H92Q144 62 144 64Q388 682 397 689Q403 698 434 698Q463 698 471 689Q475 686 538 530T663 218L724 64Q724 62 776 62H828V0H817Q796 3 658 3Q509 3 485 0H472V62H517Q561 62 561 63L517 175H262L240 120Q218 65 217 64Q217 62 261 62H306V0H296ZM390 237L492 238L440 365Q390 491 388 491Q287 239 287 237H390Z"></path></g></g><g data-mml-node="mi" transform="translate(869, 425.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(869, -293.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2190" d="M944 261T944 250T929 230H165Q167 228 182 216T211 189T244 152T277 96T303 25Q308 7 308 0Q308 -11 288 -11Q281 -11 278 -11T272 -7T267 2T263 21Q245 94 195 151T73 236Q58 242 55 247Q55 254 59 257T73 264Q121 283 158 314T215 375T247 434T264 480L267 497Q269 503 270 505T275 509T288 511Q308 511 308 500Q308 493 303 475Q293 438 278 406T246 352T215 315T185 287T165 270H929Q944 261 944 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1361, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g></g><g data-mml-node="mo" transform="translate(2738.3, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3794, 0)"><g data-mml-node="mi"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path></g><g data-mml-node="mi" transform="translate(394, 0)"><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z"></path></g><g data-mml-node="mi" transform="translate(894, 0)"><path data-c="66" d="M273 0Q255 3 146 3Q43 3 34 0H26V46H42Q70 46 91 49Q99 52 103 60Q104 62 104 224V385H33V431H104V497L105 564L107 574Q126 639 171 668T266 704Q267 704 275 704T289 705Q330 702 351 679T372 627Q372 604 358 590T321 576T284 590T270 627Q270 647 288 667H284Q280 668 273 668Q245 668 223 647T189 592Q183 572 182 497V431H293V385H185V225Q185 63 186 61T189 57T194 54T199 51T206 49T213 48T222 47T231 47T241 46T251 46H282V0H273Z"></path></g><g data-mml-node="mi" transform="translate(1266, 0)"><path data-c="74" d="M27 422Q80 426 109 478T141 600V615H181V431H316V385H181V241Q182 116 182 100T189 68Q203 29 238 29Q282 29 292 100Q293 108 293 146V181H333V146V134Q333 57 291 17Q264 -10 221 -10Q187 -10 162 2T124 33T105 68T98 100Q97 107 97 248V385H18V422H27Z"></path></g><g data-mml-node="mi" transform="translate(1655, 0)"><path data-c="6D" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q351 442 364 440T387 434T406 426T421 417T432 406T441 395T448 384T452 374T455 366L457 361L460 365Q463 369 466 373T475 384T488 397T503 410T523 422T546 432T572 439T603 442Q729 442 740 329Q741 322 741 190V104Q741 66 743 59T754 49Q775 46 803 46H819V0H811L788 1Q764 2 737 2T699 3Q596 3 587 0H579V46H595Q656 46 656 62Q657 64 657 200Q656 335 655 343Q649 371 635 385T611 402T585 404Q540 404 506 370Q479 343 472 315T464 232V168V108Q464 78 465 68T468 55T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path></g><g data-mml-node="mi" transform="translate(2488, 0)"><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z"></path></g><g data-mml-node="mi" transform="translate(2988, 0)"><path data-c="78" d="M201 0Q189 3 102 3Q26 3 17 0H11V46H25Q48 47 67 52T96 61T121 78T139 96T160 122T180 150L226 210L168 288Q159 301 149 315T133 336T122 351T113 363T107 370T100 376T94 379T88 381T80 383Q74 383 44 385H16V431H23Q59 429 126 429Q219 429 229 431H237V385Q201 381 201 369Q201 367 211 353T239 315T268 274L272 270L297 304Q329 345 329 358Q329 364 327 369T322 376T317 380T310 384L307 385H302V431H309Q324 428 408 428Q487 428 493 431H499V385H492Q443 385 411 368Q394 360 377 341T312 257L296 236L358 151Q424 61 429 57T446 50Q464 46 499 46H516V0H510H502Q494 1 482 1T457 2T432 2T414 3Q403 3 377 3T327 1L304 0H295V46H298Q309 46 320 51T331 63Q331 65 291 120L250 175Q249 174 219 133T185 88Q181 83 181 74Q181 63 188 55T206 46Q208 46 208 23V0H201Z"></path></g></g><g data-mml-node="mo" transform="translate(7310, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mfrac" transform="translate(7699, 0)"><g data-mml-node="mrow" transform="translate(220, 906.5)"><g data-mml-node="msubsup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="51" d="M64 339Q64 431 96 502T182 614T295 675T420 696Q469 696 481 695Q620 680 709 589T798 339Q798 255 768 184Q720 77 611 26L600 21Q635 -26 682 -26H696Q769 -26 769 0Q769 7 774 12T787 18Q805 18 805 -7V-13Q803 -64 785 -106T737 -171Q720 -183 697 -191Q687 -193 668 -193Q636 -193 613 -182T575 -144T552 -94T532 -27Q531 -23 530 -16T528 -6T526 -3L512 -5Q499 -7 477 -8T431 -10Q393 -10 382 -9Q238 8 151 97T64 339ZM326 80Q326 113 356 138T430 163Q492 163 542 100L553 86Q554 85 561 91T578 108Q637 179 637 330Q637 430 619 498T548 604Q500 641 425 641Q408 641 390 637T347 623T299 590T259 535Q226 469 226 338Q226 244 246 180T318 79L325 74Q326 74 326 80ZM506 58Q480 112 433 112Q412 112 395 104T378 77Q378 44 431 44Q480 44 506 58Z"></path></g></g><g data-mml-node="mi" transform="translate(864, 423.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="mi" transform="translate(864, -247) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1420.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msubsup" transform="translate(1809.3, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4B" d="M400 0Q376 3 226 3Q75 3 51 0H39V62H147V624H39V686H51Q75 683 226 683Q376 683 400 686H412V624H304V338L472 483L634 624H565V686H576Q597 683 728 683Q814 683 829 686H836V624H730L614 524Q507 432 497 422Q496 422 498 418T514 395T553 342T627 241L759 63L805 62H852V0H842Q830 3 701 3Q550 3 526 0H513V62H549Q584 62 584 63Q583 65 486 196T388 328L304 256V62H412V0H400Z"></path></g></g><g data-mml-node="mi" transform="translate(901, 413.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(901, -305.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="msup" transform="translate(3339.4, 0)"><g data-mml-node="mo"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mi" transform="translate(389, 363) scale(0.707)"><path data-c="54" d="M40 437Q21 437 21 445Q21 450 37 501T71 602L88 651Q93 669 101 677H569H659Q691 677 697 676T704 667Q704 661 687 553T668 444Q668 437 649 437Q640 437 637 437T631 442L629 445Q629 451 635 490T641 551Q641 586 628 604T573 629Q568 630 515 631Q469 631 457 630T439 622Q438 621 368 343T298 60Q298 48 386 46Q418 46 427 45T436 36Q436 31 433 22Q429 4 424 1L422 0Q419 0 415 0Q410 0 363 1T228 2Q99 2 64 0H49Q43 6 43 9T45 27Q49 40 55 46H83H94Q174 46 189 55Q190 56 191 56Q196 59 201 76T241 233Q258 301 269 344Q339 619 339 625Q339 630 310 630H279Q212 630 191 624Q146 614 121 583T67 467Q60 445 57 441T43 437H40Z"></path></g></g></g><g data-mml-node="msqrt" transform="translate(1400.5, -890.9)"><g transform="translate(1020, 0)"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="64" d="M366 683Q367 683 438 688T511 694Q523 694 523 686Q523 679 450 384T375 83T374 68Q374 26 402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487H491Q506 153 506 145Q506 140 503 129Q490 79 473 48T445 8T417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157Q33 205 53 255T101 341Q148 398 195 420T280 442Q336 442 364 400Q369 394 369 396Q370 400 396 505T424 616Q424 629 417 632T378 637H357Q351 643 351 645T353 664Q358 683 366 683ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g><g data-mml-node="mi" transform="translate(520, -150) scale(0.707)"><path data-c="71" d="M33 157Q33 258 109 349T280 441Q340 441 372 389Q373 390 377 395T388 406T404 418Q438 442 450 442Q454 442 457 439T460 434Q460 425 391 149Q320 -135 320 -139Q320 -147 365 -148H390Q396 -156 396 -157T393 -175Q389 -188 383 -194H370Q339 -192 262 -192Q234 -192 211 -192T174 -192T157 -193Q143 -193 143 -185Q143 -182 145 -170Q149 -154 152 -151T172 -148Q220 -148 230 -141Q238 -136 258 -53T279 32Q279 33 272 29Q224 -10 172 -10Q117 -10 75 30T33 157ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g></g></g><g data-mml-node="mo" transform="translate(0, 20.9)"><path data-c="221A" d="M263 249Q264 249 315 130T417 -108T470 -228L725 302Q981 837 982 839Q989 850 1001 850Q1008 850 1013 844T1020 832V826L741 243Q645 43 540 -176Q479 -303 469 -324T453 -348Q449 -350 436 -350L424 -349L315 -96Q206 156 205 156L171 130Q138 104 137 104L111 130L263 249Z"></path></g><rect width="895.3" height="60" x="1020" y="810.9"></rect></g><rect width="4476.2" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(12637.5, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(13637.7, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">β</tspan></text></g></g><g data-mml-node="msubsup" transform="translate(14456.7, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4D" d="M314 0Q296 3 181 3T48 0H39V62H147V624H39V686H305Q316 679 323 667Q330 653 434 414L546 157L658 414Q766 662 773 674Q778 681 788 686H1052V624H944V62H1052V0H1040Q1016 3 874 3T708 0H696V62H804V341L803 618L786 580Q770 543 735 462T671 315Q540 13 536 9Q528 1 507 1Q485 1 477 9Q472 14 408 162T281 457T217 603Q215 603 215 334V62H323V0H314Z"></path></g></g><g data-mml-node="mi" transform="translate(1092, 413.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(1092, -305.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2190" d="M944 261T944 250T929 230H165Q167 228 182 216T211 189T244 152T277 96T303 25Q308 7 308 0Q308 -11 288 -11Q281 -11 278 -11T272 -7T267 2T263 21Q245 94 195 151T73 236Q58 242 55 247Q55 254 59 257T73 264Q121 283 158 314T215 375T247 434T264 480L267 497Q269 503 270 505T275 509T288 511Q308 511 308 500Q308 493 303 475Q293 438 278 406T246 352T215 315T185 287T165 270H929Q944 261 944 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1361, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g></g><g data-mml-node="mo" transform="translate(17140.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(17529.2, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">对应的邻域聚合结果为：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{O}^w_{t←τ}=\mathbf{A}^w_{t←τ}\mathbf{V}^w_τ.
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -738.3 8025.7 1184.8" aria-hidden="true" style="max-width: 300%;vertical-align: -1.01ex;width: 18.158ex;height: 2.68ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4F" d="M64 339Q64 431 96 502T182 614T295 675T420 696Q469 696 481 695Q620 680 709 589T798 339Q798 173 697 82T432 -10Q262 -10 163 85T64 339ZM625 454Q618 502 600 538T562 593T515 624T469 639T431 642Q331 642 276 563Q232 493 232 353Q232 315 234 285T244 216T267 148T308 94T372 56Q405 46 432 46Q517 46 567 106T627 267Q631 299 631 353Q631 418 625 454Z"></path></g></g><g data-mml-node="mi" transform="translate(864, 423.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(864, -295.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2190" d="M944 261T944 250T929 230H165Q167 228 182 216T211 189T244 152T277 96T303 25Q308 7 308 0Q308 -11 288 -11Q281 -11 278 -11T272 -7T267 2T263 21Q245 94 195 151T73 236Q58 242 55 247Q55 254 59 257T73 264Q121 283 158 314T215 375T247 434T264 480L267 497Q269 503 270 505T275 509T288 511Q308 511 308 500Q308 493 303 475Q293 438 278 406T246 352T215 315T185 287T165 270H929Q944 261 944 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1361, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g></g><g data-mml-node="mo" transform="translate(2733.3, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msubsup" transform="translate(3789, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="41" d="M296 0Q278 3 164 3Q58 3 49 0H40V62H92Q144 62 144 64Q388 682 397 689Q403 698 434 698Q463 698 471 689Q475 686 538 530T663 218L724 64Q724 62 776 62H828V0H817Q796 3 658 3Q509 3 485 0H472V62H517Q561 62 561 63L517 175H262L240 120Q218 65 217 64Q217 62 261 62H306V0H296ZM390 237L492 238L440 365Q390 491 388 491Q287 239 287 237H390Z"></path></g></g><g data-mml-node="mi" transform="translate(869, 425.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(869, -293.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2190" d="M944 261T944 250T929 230H165Q167 228 182 216T211 189T244 152T277 96T303 25Q308 7 308 0Q308 -11 288 -11Q281 -11 278 -11T272 -7T267 2T263 21Q245 94 195 151T73 236Q58 242 55 247Q55 254 59 257T73 264Q121 283 158 314T215 375T247 434T264 480L267 497Q269 503 270 505T275 509T288 511Q308 511 308 500Q308 493 303 475Q293 438 278 406T246 352T215 315T185 287T165 270H929Q944 261 944 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1361, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g></g><g data-mml-node="msubsup" transform="translate(6249.5, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="56" d="M592 686H604Q615 685 631 685T666 684T700 684T724 683Q829 683 835 686H843V624H744L611 315Q584 254 546 165Q492 40 482 19T461 -6L460 -7H409Q398 -4 391 9Q385 20 257 315L124 624H25V686H36Q57 683 190 683Q340 683 364 686H377V624H289L384 403L480 185L492 212Q504 240 529 298T575 405L670 624H582V686H592Z"></path></g></g><g data-mml-node="mi" transform="translate(869, 413.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(869, -305.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="mo" transform="translate(7747.7, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">随后，来自多个邻近帧的结果通过时间门控权重聚合：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{O}^w_t=\sum\limits_τ{} α_τ\mathbf{O}^w_{t←τ}.
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -950 8546.1 2338.8" aria-hidden="true" style="max-width: 300%;vertical-align: -3.142ex;width: 19.335ex;height: 5.291ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4F" d="M64 339Q64 431 96 502T182 614T295 675T420 696Q469 696 481 695Q620 680 709 589T798 339Q798 173 697 82T432 -10Q262 -10 163 85T64 339ZM625 454Q618 502 600 538T562 593T515 624T469 639T431 642Q331 642 276 563Q232 493 232 353Q232 315 234 285T244 216T267 148T308 94T372 56Q405 46 432 46Q517 46 567 106T627 267Q631 299 631 353Q631 418 625 454Z"></path></g></g><g data-mml-node="mi" transform="translate(864, 423.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="mi" transform="translate(864, -247) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1698.1, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="munder" transform="translate(2753.8, 0)"><g data-mml-node="mo"><path data-c="2211" d="M60 948Q63 950 665 950H1267L1325 815Q1384 677 1388 669H1348L1341 683Q1320 724 1285 761Q1235 809 1174 838T1033 881T882 898T699 902H574H543H251L259 891Q722 258 724 252Q725 250 724 246Q721 243 460 -56L196 -356Q196 -357 407 -357Q459 -357 548 -357T676 -358Q812 -358 896 -353T1063 -332T1204 -283T1307 -196Q1328 -170 1348 -124H1388Q1388 -125 1381 -145T1356 -210T1325 -294L1267 -449L666 -450Q64 -450 61 -448Q55 -446 55 -439Q55 -437 57 -433L590 177Q590 178 557 222T452 366T322 544L56 909L55 924Q55 945 60 948Z"></path></g><g data-mml-node="TeXAtom" transform="translate(432.4, -1147.3) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(4364.5, 0)"></g><g data-mml-node="msub" transform="translate(4364.5, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">α</tspan></text></g></g><g data-mml-node="TeXAtom" transform="translate(819, -235.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g><g data-mml-node="msubsup" transform="translate(5812.6, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4F" d="M64 339Q64 431 96 502T182 614T295 675T420 696Q469 696 481 695Q620 680 709 589T798 339Q798 173 697 82T432 -10Q262 -10 163 85T64 339ZM625 454Q618 502 600 538T562 593T515 624T469 639T431 642Q331 642 276 563Q232 493 232 353Q232 315 234 285T244 216T267 148T308 94T372 56Q405 46 432 46Q517 46 567 106T627 267Q631 299 631 353Q631 418 625 454Z"></path></g></g><g data-mml-node="mi" transform="translate(864, 423.1) scale(0.707)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(864, -295.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2190" d="M944 261T944 250T929 230H165Q167 228 182 216T211 189T244 152T277 96T303 25Q308 7 308 0Q308 -11 288 -11Q281 -11 278 -11T272 -7T267 2T263 21Q245 94 195 151T73 236Q58 242 55 247Q55 254 59 257T73 264Q121 283 158 314T215 375T247 434T264 480L267 497Q269 503 270 505T275 509T288 511Q308 511 308 500Q308 493 303 475Q293 438 278 406T246 352T215 315T185 287T165 270H929Q944 261 944 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1361, 0)"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="819.2px" font-family="serif"><tspan leaf="">τ</tspan></text></g></g></g></g><g data-mml-node="mo" transform="translate(8268.1, 0)"><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这一过程等价于在局部时空窗口中构建一个动态图结构，通过 attention 定义边权，通过 value 聚合实现消息传播。相比显式光流，TSGM 不需要先验运动场，而是根据特征相似性和时间兼容性自适应建立跨帧关联，因此更适合强噪声和复杂运动视频。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">六、实验设置：覆盖合成噪声、真实噪声与生物成像场景</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为系统验证 SINF 的有效性，论文在多个典型视频去噪数据集上进行了实验，覆盖合成噪声、真实自然噪声以及生物显微成像噪声等不同场景。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在合成噪声实验中，论文采用 DAVIS 和 Set8 数据集。DAVIS 包含大量具有复杂动态和多样运动模式的高质量自然视频，Set8 则是视频恢复任务中常用的高帧率测试集。研究在干净视频上添加不同强度的高斯噪声，用于评估模型在可控噪声水平下的恢复能力。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.5731481481481482" data-type="png" data-w="1080" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-imgfileid="100175734" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=445fca32&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicqaeBUIoO5r4C4zbbUj7bI0lHmfLO1auV0IjwXfM8icoMl0RGMibnceAK1azicaHoKibPYU3Ueybj3RKkiayFT5jKcWiclpQRhFViaOA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/><img class="rich_pages wxw-img" data-ratio="0.5148148148148148" data-type="png" data-w="1080" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-imgfileid="100175735" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=b2bcf7b6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicXUDmQ9uc4cXCDdaQOvIiasYC0oZ96cOJ6kPHYrg4icrFb27icN6wz8SwtaESTeRtYcyrVW0QTdGP6icDc46ZL2o0Jp1QWvicc3d6I%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在真实噪声实验中，采用 CRVD 数据集，包含不同 ISO 条件下采集的真实 raw 视频，能够反映真实相机成像过程中的高 ISO 噪声、空间非均匀噪声和动态场景噪声。相比合成噪声，CRVD 更能检验模型在真实成像环境中的鲁棒性。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.2916666666666667" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175731" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=028d2ddb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicFDby9O1PrPibfNtajtGFYHiaCdmicQML94iawJvuuap09VWobdnYJFvSRNFKFPvHnETeRFciaDgbkZSibbV7ibJIFXCictv3nibq0Pcc0%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><table><tbody><tr><td style="font-size: 14px;"><p style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><img class="rich_pages wxw-img" data-ratio="0.875886524822695" data-type="png" data-w="846" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-imgfileid="100175733" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=9fae284e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibO9juH92EJqg1RT98zLtoj5LXMKibuTctp8BecQszxIlTr2z4OOmXKeBdf0MgyIyJ8OmlYaHic2wwIqricR7ch0tKM08iaGwVeB3Y%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></p></td><td style="font-size: 14px;"><p style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><img class="rich_pages wxw-img" data-ratio="0.9269729093050648" data-type="png" data-w="849" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-imgfileid="100175739" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=3c5c6b3a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibWlF16KJkpFooRyibhnVpiauX3C8eDXvSGlW9GIvjPWzDicOSWWKIU5A9aBYQ8mUN6hNw6hcdtHvicw4anwaOxlZUGbMYdwicFOkcg%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></p></td></tr></tbody></table><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在生物成像实验中，论文进一步采用 DeepCAD 相关荧光显微视频数据，包括小鼠脑中性粒细胞、斑马鱼视顶盖神经元以及斑马鱼脑区等低信噪比体内成像序列。这类数据具有典型的 AI for Science 特征：信号弱、噪声强、结构细微。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.48703703703703705" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175740" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=c50c60bf&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibsMmV8AUDEQeTpxYBAo1mu0N3fjOZmpl74NP8y4icfvbnO5vDr08gFRMEKb6cgQNiaibJQgBEwDTcVlqibshcRsd89wMUGSYyPibibc%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">七、前景：面向 AI for Science 的无监督连续视频恢复</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">论文将无监督视频去噪从传统离散网格问题重新表述为连续时空隐式场学习问题。该视角突破了传统视频恢复中帧序列和像素网格的限制，提出了一种坐标驱动的连续视觉建模范式。过去大量低层视觉方法默认图像和视频是离散网格信号，而 SINF 进一步指出，真实视觉信号应被理解为连续场，低层视觉恢复任务也可以被重新表述为从噪声离散采样中恢复连续隐式函数。这一思想与 NeRF、Dynamic Neural Field、连续超分辨率和神经场建模等方向形成了自然联系，为未来视频复原、动态场景理解和科学成像提供了新的研究路径。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">SINF 的潜在应用价值不仅局限于自然视频去噪。在 AI for Science 和生物医学成像领域，该方法具有尤其重要的意义。许多科学成像任务面临相似问题：观测信号弱、噪声强、动态结构复杂、干净标签难以获得。例如，在荧光显微成像中，为了降低光毒性和保护活体样本，成像过程通常需要减少激发光强或缩短曝光时间，这会显著降低信噪比；在神经活动成像中，细胞或神经元结构随时间变化，模型必须同时保持空间结构真实性和时间动态一致性。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">该研究体现了低层视觉、计算成像和连续神经表示方向上的交叉创新；论文代码已初步开源，便于相关研究者复现、拓展与应用。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.125" data-type="gif" data-w="960" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175737" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=15bd75e5&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGWibCia3XpFgSYfNUL1McAwYQf9zXPh9icN740GPHbUHnM9iaG9ARmEz10ibBADsz0ZqYEg68mg9dP8wRPib25PsWWwVXawcU10oQdSMU%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-ratio="0.7064814814814815" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175738" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=0f96f428&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9829DyLbP5P6icqibJ76WQO3wf7lcwDK3CqhuB7TiaRxxT1pI4iazDttZTWgewFSArTZ8wNjv0uKCbkPL5zQTAo5Runqj0mxcM5Qc%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=aa49f885&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659418%26idx%3D1%26sn%3D780633209d8f780b651773536c4ec989">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Sat, 09 May 2026 23:31:00 +0800</pubDate>
    </item>
    <item>
      <title>从CVPR26等顶会来看，注意力机制的趋势已经很明显了</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659351&amp;idx=1&amp;sn=4bfc35ca547bd92c2a8b0c41200f6786</link>
      <description></description>
      <content:encoded><![CDATA[<p><span>我爱计算机视觉</span> <span>2026-05-07 17:41</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=6d3bde5c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWibkM2K6RFJ7NiadmdBeqxkdLTQDLCuknZcZf8yqicCCicxuPsHF9j5o2GCgS6iaW9xNFIZtaA0tiadztuqZ9OaM862WyxDHUHgQzPY4%2F0%3Fwx_fmt%3Djpeg"/></p>
  
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 10px;padding-right: 10px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;font-family: &#34;Microsoft YaHei&#34;, PingFangSC-regular, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;" data-pm-slice="0 0 []"><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span leaf="">回看近两年的顶会成果，<span textstyle="" style="font-weight: bold;">注意力机制</span>的创新趋势已经很明显了：纯改权重、堆头数那套基本卷无可卷，但把注意力机制当基础设施去解决效率、跨模态对齐或者长序列建模痛点，还是很有搞头的。</span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span leaf=""><span textstyle="" style="color: rgb(217, 33, 66);font-weight: bold;">本文精选了CVPR、ICLR、ICML、AAAI、ACL、WWW、ICASSP、SIGIR、ICSE 2026中极具代表性的147篇工作。</span>看完你就能发现：<span textstyle="" style="font-weight: bold;">线性注意力、细粒度跨模态对齐、轻量化设计</span>才是现在注意力机制出成果最快的三条路。</span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span leaf="">建议感兴趣的朋友人手一份，直接参考合集里的论文可以帮你省下不少筛资料的时间，还能加速摸清研究脉络、对标前沿思路，快人一步找到那个能中的idea。</span></p><figure data-tool="mdnice编辑器" style="margin-top: 10px;margin-bottom: 10px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;"><span leaf=""><img class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-aistatus="1" data-imgfileid="100023814" data-ratio="1.7777777777777777" style="display: block;margin-top: 0px;margin-right: auto;margin-bottom: 0px;margin-left: auto;max-width: 100%;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;" data-type="png" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=23865e49&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FGBGgDA2CUoUT7nJf9p3yf0f7z74dJqbj8pQJFkK8JbmE1fwiadTWYo6fTqp25zbzQjTOTmAnhoVzwP9UVKaShlzbjv5qeAyvd67ic5bfMAaZ4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D0"/></span></figure></div><p data-pm-slice="0 0 []" style="margin: 0px;padding: 0px 0px 12px;outline: 0px;max-width: 100%;clear: both;min-height: 28px;color: rgb(0, 0, 0);font-size: 16px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-family: Roboto, Oxygen, Ubuntu, Cantarell, PingFangSC-light, PingFangTC-light, &#34;Open Sans&#34;, &#34;Helvetica Neue&#34;, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 0.578px;text-align: center;line-height: 1.8;font-stretch: normal;font-variant-numeric: normal;text-rendering: optimizelegibility;text-size-adjust: inherit;-webkit-font-smoothing: antialiased;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;color: rgb(217, 33, 66);letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">扫码添加小享，</span></span></strong></span><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.578px;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">回复“</span></span><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;color: rgb(217, 33, 66);visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">注意力合集</span></span></span></strong></span></span><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.578px;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">”</span></span></strong></span></span></p><p style="margin: 0px;padding: 0px 0px 12px;outline: 0px;max-width: 100%;clear: both;min-height: 28px;color: rgb(0, 0, 0);font-size: 16px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-family: Roboto, Oxygen, Ubuntu, Cantarell, PingFangSC-light, PingFangTC-light, &#34;Open Sans&#34;, &#34;Helvetica Neue&#34;, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 0.578px;text-align: center;line-height: 1.8;font-stretch: normal;font-variant-numeric: normal;text-rendering: optimizelegibility;text-size-adjust: inherit;-webkit-font-smoothing: antialiased;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">免费获取</span><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">全部论文+开源代码</span></strong></span></p><p style="margin: 0px;padding: 0px 0px 12px;outline: 0px;max-width: 100%;clear: both;min-height: 28px;color: rgb(0, 0, 0);font-size: 16px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-family: Roboto, Oxygen, Ubuntu, Cantarell, PingFangSC-light, PingFangTC-light, &#34;Open Sans&#34;, &#34;Helvetica Neue&#34;, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 0.578px;text-align: center;line-height: 1.8;font-stretch: normal;font-variant-numeric: normal;text-rendering: optimizelegibility;text-size-adjust: inherit;-webkit-font-smoothing: antialiased;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: 0.75px;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><img data-aistatus="1" class="rich_pages wxw-img" data-ratio="1" data-s="300,640" data-type="webp" data-w="800" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;vertical-align: bottom;letter-spacing: 2px;box-sizing: border-box !important;overflow-wrap: break-word !important;height: auto !important;width: 114px !important;visibility: visible !important;" data-croporisrc="https://mmbiz.qpic.cn/mmbiz_jpg/P9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c/0?wx_fmt=webp&amp;from=appmsg" data-cropselx2="114" data-cropsely2="114" data-imgfileid="100173703" src="https://wechat2rss.xlab.app/img-proxy/?k=2bbd5f43&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c%2F640%3Fwx_fmt%3Dwebp%26from%3Dappmsg"/></span></strong></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;text-indent: 0em;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;"><span leaf=""><span textstyle="" style="font-weight: bold;">以下是部分顶会论文简析：</span></span></p><h4 data-tool="mdnice编辑器" style="margin-top: 30px;margin-bottom: 15px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;"><span style="font-size: 18px;color: rgb(0, 0, 0);line-height: 1.5em;letter-spacing: 0em;text-align: left;font-weight: bold;display: block;"><span leaf="">【CVPR 2026】UCAN: Unified Convolutional Attention Network for Expansive Receptive Fields in Lightweight Super-Resolution</span></span></h4><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;text-indent: 0em;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;"><strong style="color: rgb(37, 132, 181);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">研究方法：</span></strong><span leaf="">论文提出轻量级图像超分网络 UCAN，以Flash Attention 实现高效大窗口注意力、Hedgehog Attention 增强线性注意力特征秩与多样性、混合注意力融合局部与全局依赖，并结合跨层参数共享与大核蒸馏模块，在低计算量下有效扩大感受野。</span></p><figure data-tool="mdnice编辑器" style="margin-top: 10px;margin-bottom: 10px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;"><span leaf=""><img class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-aistatus="1" data-imgfileid="100023813" data-ratio="0.6194444444444445" style="display: block;margin-top: 0px;margin-right: auto;margin-bottom: 0px;margin-left: auto;max-width: 100%;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;" data-type="png" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=33b93fa3&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FGBGgDA2CUoVm3rcjXPBWHIqAKSYEFpvCg2p8XhAn5O9EQWHqPeUgr1awMlj04oZQT6xQF01decx4tlCPPO2E2icPEpXk49oTr40V0DsaqgJk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D2"/></span></figure><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;text-indent: 0em;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;"><strong style="color: rgb(37, 132, 181);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">创新点：</span></strong></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 25px;padding-right: 0px;color: rgb(0, 0, 0);" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">提出Hedgehog Attention，通过Hedgehog特征映射提升线性注意力的特征秩与多样性，解决传统线性注意力秩坍塌、信息丢失的问题。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">构建UCAN轻量化网络，融合Flash Attention实现高效大窗口注意力、混合注意力兼顾局部与全局依赖，搭配跨层半参数共享机制降低计算量。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">设计大核蒸馏模块LKD，采用多分支并行结构与膨胀可分离卷积，以低参量开销扩大感受野，保留图像高频细节与复杂纹理。</span></p></li></ul><figure data-tool="mdnice编辑器" style="margin-top: 10px;margin-bottom: 10px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;"><span leaf=""><img data-aistatus="1" class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-ratio="0.5486725663716814" data-type="png" data-w="1017" style="display: block;margin-top: 0px;margin-right: auto;margin-bottom: 0px;margin-left: auto;max-width: 100%;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;" data-imgfileid="100023810" src="https://wechat2rss.xlab.app/img-proxy/?k=091af0fc&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FGBGgDA2CUoXPRIZDzgfyM1Q8rK0fCa6q3yFeS5yeo0yhJHUUxtPl4ia9eVZZwrfIN4YnVxuibc9YTCF8ocXW00VZgDm7pIs7x1iahcwyMpcBX4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D3"/></span></figure><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;text-indent: 0em;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;"><strong style="color: rgb(37, 132, 181);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">研究价值：</span></strong><span leaf="">UCAN作为轻量化图像超分网络，通过融合卷积与注意力、创新Hedgehog Attention与大核蒸馏机制，在大幅降低参数量与计算量的前提下，有效扩大感受野并提升重建精度，为端侧等资源受限场景提供了性能与效率更均衡的实用解决方案。</span></p><p data-pm-slice="5 3 []" style="margin: 0px;padding: 0px 0px 12px;outline: 0px;max-width: 100%;clear: both;min-height: 28px;color: rgb(0, 0, 0);font-size: 16px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-family: Roboto, Oxygen, Ubuntu, Cantarell, PingFangSC-light, PingFangTC-light, &#34;Open Sans&#34;, &#34;Helvetica Neue&#34;, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 0.578px;text-align: center;line-height: 1.8;font-stretch: normal;font-variant-numeric: normal;text-rendering: optimizelegibility;text-size-adjust: inherit;-webkit-font-smoothing: antialiased;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;color: rgb(217, 33, 66);letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">扫码添加小享，</span></span></strong></span><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.578px;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">回复“</span></span><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;color: rgb(217, 33, 66);visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">注意力合集</span></span></span></strong></span></span><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.578px;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">”</span></span></strong></span></span></p><p style="margin: 0px;padding: 0px 0px 12px;outline: 0px;max-width: 100%;clear: both;min-height: 28px;color: rgb(0, 0, 0);font-size: 16px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-family: Roboto, Oxygen, Ubuntu, Cantarell, PingFangSC-light, PingFangTC-light, &#34;Open Sans&#34;, &#34;Helvetica Neue&#34;, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 0.578px;text-align: center;line-height: 1.8;font-stretch: normal;font-variant-numeric: normal;text-rendering: optimizelegibility;text-size-adjust: inherit;-webkit-font-smoothing: antialiased;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">免费获取</span><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">全部论文+开源代码</span></strong></span></p><p style="margin: 0px;padding: 0px 0px 12px;outline: 0px;max-width: 100%;clear: both;min-height: 28px;color: rgb(0, 0, 0);font-size: 16px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-family: Roboto, Oxygen, Ubuntu, Cantarell, PingFangSC-light, PingFangTC-light, &#34;Open Sans&#34;, &#34;Helvetica Neue&#34;, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 0.578px;text-align: center;line-height: 1.8;font-stretch: normal;font-variant-numeric: normal;text-rendering: optimizelegibility;text-size-adjust: inherit;-webkit-font-smoothing: antialiased;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: 0.75px;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><img data-aistatus="1" class="rich_pages wxw-img" data-ratio="1" data-s="300,640" data-type="webp" data-w="800" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;vertical-align: bottom;letter-spacing: 2px;box-sizing: border-box !important;overflow-wrap: break-word !important;height: auto !important;width: 114px !important;visibility: visible !important;" data-croporisrc="https://mmbiz.qpic.cn/mmbiz_jpg/P9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c/0?wx_fmt=webp&amp;from=appmsg" data-cropselx2="114" data-cropsely2="114" data-imgfileid="100173703" src="https://wechat2rss.xlab.app/img-proxy/?k=2bbd5f43&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c%2F640%3Fwx_fmt%3Dwebp%26from%3Dappmsg"/></span></strong></p><h4 data-tool="mdnice编辑器" style="margin-top: 30px;margin-bottom: 15px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;"><span style="font-size: 18px;color: rgb(0, 0, 0);line-height: 1.5em;letter-spacing: 0em;text-align: left;font-weight: bold;display: block;"><span leaf="">【ICLR 2026】TS-Attn: Temporal-wise Separable Attention for Multi-Event Video Generation</span></span></h4><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;text-indent: 0em;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;"><strong style="color: rgb(37, 132, 181);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">研究方法：</span></strong><span leaf="">论文提出无需训练的时序可分离注意力 TS-Attn，先精准提取视频中的运动区域，再对视频 - 文本跨注意力进行时序维度的重分配与自适应强化，有效解耦多事件间的注意力冲突，让生成内容严格遵循时序逻辑并保持全局一致性。</span></p><figure data-tool="mdnice编辑器" style="margin-top: 10px;margin-bottom: 10px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;"><span leaf=""><img class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-aistatus="1" data-imgfileid="100023812" data-ratio="0.5333333333333333" style="display: block;margin-top: 0px;margin-right: auto;margin-bottom: 0px;margin-left: auto;max-width: 100%;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;" data-type="png" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=34c3358b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FGBGgDA2CUoW6yII2ocicObljHo74X4eicMErT54TbCCc6icibL6ARaLl8qJcibf128umbNALTE2W5TfqDxHQrxSj6d7GqwYwpmm64Xicvh6qHfhE4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D5"/></span></figure><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;text-indent: 0em;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;"><strong style="color: rgb(37, 132, 181);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">创新点：</span></strong></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 25px;padding-right: 0px;color: rgb(0, 0, 0);" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">提出时序可分离注意力TS-Attn，以无需训练的方式动态重构跨注意力分布，解决多事件视频生成中的时序错位与耦合问题。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">设计运动区域提取模块，精准定位视频中动作相关区域，让注意力调制仅作用于运动主体，避免背景干扰与画面闪烁。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">构建事件感知注意力调制，通过注意力重排与自适应增强，强化时序对应事件关联、弱化无关事件干扰，可即插即用集成到主流视频生成模型。</span></p></li></ul><figure data-tool="mdnice编辑器" style="margin-top: 10px;margin-bottom: 10px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;"><span leaf=""><img class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-aistatus="1" data-imgfileid="100023811" data-ratio="0.3425925925925926" style="display: block;margin-top: 0px;margin-right: auto;margin-bottom: 0px;margin-left: auto;max-width: 100%;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;" data-type="png" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=3ca7dab2&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FGBGgDA2CUoV8sl9p5bSlOqArXCW1MRQ1YWK3oo8Kyic09UEET6H3Q8NMicjgHeqsUDjAbucibiaCZupsRM9cKxkzYRqSenyF4iajEOpOfnbBvb58%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D6"/></span></figure><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;text-indent: 0em;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;"><strong style="color: rgb(37, 132, 181);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">研究价值：</span></strong><span leaf="">TS-Attn作为免训练、低延时、即插即用的注意力机制，有效解决多事件视频生成的时序错位与事件冲突问题，大幅提升文本遵循度与时序连贯性，可无缝适配各类视频生成模型，为复杂时序描述的高质量视频生成提供高效通用解决方案。</span></p><p data-pm-slice="5 3 []" style="margin: 0px;padding: 0px 0px 12px;outline: 0px;max-width: 100%;clear: both;min-height: 28px;color: rgb(0, 0, 0);font-size: 16px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-family: Roboto, Oxygen, Ubuntu, Cantarell, PingFangSC-light, PingFangTC-light, &#34;Open Sans&#34;, &#34;Helvetica Neue&#34;, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 0.578px;text-align: center;line-height: 1.8;font-stretch: normal;font-variant-numeric: normal;text-rendering: optimizelegibility;text-size-adjust: inherit;-webkit-font-smoothing: antialiased;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;color: rgb(217, 33, 66);letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">扫码添加小享，</span></span></strong></span><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.578px;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">回复“</span></span><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;color: rgb(217, 33, 66);visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">注意力合集</span></span></span></strong></span></span><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.578px;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: normal;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">”</span></span></strong></span></span></p><p style="margin: 0px;padding: 0px 0px 12px;outline: 0px;max-width: 100%;clear: both;min-height: 28px;color: rgb(0, 0, 0);font-size: 16px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-family: Roboto, Oxygen, Ubuntu, Cantarell, PingFangSC-light, PingFangTC-light, &#34;Open Sans&#34;, &#34;Helvetica Neue&#34;, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 0.578px;text-align: center;line-height: 1.8;font-stretch: normal;font-variant-numeric: normal;text-rendering: optimizelegibility;text-size-adjust: inherit;-webkit-font-smoothing: antialiased;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;font-synthesis: style;letter-spacing: 0.8px;text-align: left;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">免费获取</span><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;">全部论文+开源代码</span></strong></span></p><p style="margin: 0px;padding: 0px 0px 12px;outline: 0px;max-width: 100%;clear: both;min-height: 28px;color: rgb(0, 0, 0);font-size: 16px;font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;white-space: normal;text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;font-family: Roboto, Oxygen, Ubuntu, Cantarell, PingFangSC-light, PingFangTC-light, &#34;Open Sans&#34;, &#34;Helvetica Neue&#34;, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 0.578px;text-align: center;line-height: 1.8;font-stretch: normal;font-variant-numeric: normal;text-rendering: optimizelegibility;text-size-adjust: inherit;-webkit-font-smoothing: antialiased;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;letter-spacing: 0.75px;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span leaf="" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><img data-aistatus="1" class="rich_pages wxw-img" data-ratio="1" data-s="300,640" data-type="webp" data-w="800" style="margin: 0px;padding: 0px;outline: 0px;max-width: 100%;vertical-align: bottom;letter-spacing: 2px;box-sizing: border-box !important;overflow-wrap: break-word !important;height: auto !important;width: 114px !important;visibility: visible !important;" data-croporisrc="https://mmbiz.qpic.cn/mmbiz_jpg/P9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c/0?wx_fmt=webp&amp;from=appmsg" data-cropselx2="114" data-cropsely2="114" data-imgfileid="100173703" src="https://wechat2rss.xlab.app/img-proxy/?k=2bbd5f43&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c%2F640%3Fwx_fmt%3Dwebp%26from%3Dappmsg"/></span></strong></p><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=1dafed9c&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659351%26idx%3D1%26sn%3D4bfc35ca547bd92c2a8b0c41200f6786">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Thu, 07 May 2026 17:41:00 +0800</pubDate>
    </item>
    <item>
      <title>重磅发布 |《2026 人工智能科研辅导反欺诈白皮书》（附免费下载）</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659351&amp;idx=2&amp;sn=d627fa7b75876927aa42573473eae8da</link>
      <description>Share an article.</description>
      <content:encoded><![CDATA[<p><span>我爱计算机视觉</span> <span>2026-05-07 17:41</span> <span style="display: inline-block;">江苏</span></p>


  <p>Share an article.</p>
  <p><strong>深度之眼官方账号</strong>: <a href="http://mp.weixin.qq.com/s?__biz=MzkyODY0NTQzNg%3D%3D&amp;mid=2247491175&amp;idx=1&amp;sn=3609214b26704c3f93c61191c8a25db4&amp;scene=45#wechat_redirect">重磅发布 |《2026 人工智能科研辅导反欺诈白皮书》（附免费下载）</a></p>





  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=0f0cbc1a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FgN8cLfJicwibtwc8oKibMRgQrVkPmoaZYicL7IJG5ibngibqKNias4qOq5QDG2yoUp5pNibkTia01VpUBLXYibFbYEuxPzu4ykTh2Xd70bI7CRLy5iasSc%2F0%3Fwx_fmt%3Djpeg"/></p>
  
  <p style="text-align: center;" nodeleaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100007511" data-ratio="1.65" data-s="300,640" type="block" data-type="png" data-w="1000" src="https://wechat2rss.xlab.app/img-proxy/?k=8d668301&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FgN8cLfJicwibv872acwd5mjjibbQmsQ8gZrgIibsruwUK37ry3pe8ics2NJnTsRDcv6XFfqo5DZjlnTHAU384DS8NibUsI5Jl0cpMrH7AbGZ2Twjo%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></p><p style="text-align: center;" nodeleaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100007513" data-ratio="3.377" data-s="300,640" data-type="png" data-w="1000" type="block" style="pointer-events: initial;" src="https://wechat2rss.xlab.app/img-proxy/?k=c81bfdeb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FgN8cLfJicwibtmB6aJrhrgMkjic2UFohUQGFxcewWlxuS0vkJDIkGL9WOia5LtTaa1Rjl3OcLpHbQ3OqYFR6yHJkL9icbc3bRLz5gW1V4nMDicibicw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></p><p style="text-align: center;" nodeleaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100007525" data-ratio="1.573" data-s="300,640" data-type="png" data-w="1000" type="block" style="pointer-events: initial;" src="https://wechat2rss.xlab.app/img-proxy/?k=79762b62&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FgN8cLfJicwibvHd8g1nBkHnvuibpicDibyjQQllo5g1NcNjYcEznHIxFGV7ynic5kad3zRENrtoLII3YiaCRhOVua857gNOTYCtO4PfKOjbs50t0qk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></p><p style="text-align: center;" nodeleaf=""><img data-aistatus="1" class="rich_pages wxw-img" data-ratio="3.365" data-s="300,640" data-type="png" data-w="1000" type="block" data-imgfileid="100007516" src="https://wechat2rss.xlab.app/img-proxy/?k=f3642c5d&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FgN8cLfJicwibv76Ticw9sg8ZluHc9lK1sJgTT6nE0qSJUHU1icw4r2RoOiao9IN3EjtDytK3jL4V65ye34ibcC6XpicUVhVqcJ8pic3XV1uoKvD1KHk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></p><p style="text-align: center;" nodeleaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100007526" data-ratio="2.089" data-s="300,640" type="block" data-type="png" data-w="1000" src="https://wechat2rss.xlab.app/img-proxy/?k=3c79e03c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FgN8cLfJicwibu1UrSwOvwR5E0iajdrnbxHliadKpoeP8F6pu3DJDMH3vhgFBM0adx6glUYorm9UkQHpdgrzemxQX4ictLAZOY0ZBKqf5SibIeTyIY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></p><p style="text-align: center;" nodeleaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100007524" data-ratio="1.573" data-s="300,640" data-type="png" data-w="1000" type="block" style="pointer-events: initial;" src="https://wechat2rss.xlab.app/img-proxy/?k=79762b62&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FgN8cLfJicwibvHd8g1nBkHnvuibpicDibyjQQllo5g1NcNjYcEznHIxFGV7ynic5kad3zRENrtoLII3YiaCRhOVua857gNOTYCtO4PfKOjbs50t0qk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></p><p style="display: none;"><mp-style-type data-value="10000"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=7f17979e&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659351%26idx%3D2%26sn%3Dd627fa7b75876927aa42573473eae8da">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Thu, 07 May 2026 17:41:00 +0800</pubDate>
    </item>
    <item>
      <title>CVPR 2026 Highlight | 艾伦AI研究所等发布 VideoNet：1000 种专业动作难倒 GPT-5，更细致的视频理解基准</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659350&amp;idx=1&amp;sn=e92bc2d79ebc6681b01d26179c43905c</link>
      <description>专业动作识别，VLM 还有多远？</description>
      <content:encoded><![CDATA[<p><span>CV君</span> <span>2026-05-06 22:30</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=49af2314&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGW8ibAAt1kiaiaxkOPeSeyUhxT8yojZbBNSPuZb0NOic2DZLd6FzDrkaRNWw61pialFw4IoqwzRCiaLAKmaaasvyoRwrSr8HVaSOniag7A%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>专业动作识别，VLM 还有多远？</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175689" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2778649921507064" data-w="637" src="https://wechat2rss.xlab.app/img-proxy/?k=bc7ef219&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGWicFQUK8nhJxb1YdLKhsT8BFIjYHufFH70GuYAQfVhCoCVDzwfpF7wxImwQ2clENbxov3LyttNKib6qWMQKFaDPS7vqSlaicG0M88%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在多模态大模型（VLM）飞速发展的今天，我们习惯了让模型描述视频里“有人在跑步”或者“猫在跳跃”。但如果你问它：“这个花样滑冰动作是三周半跳（Triple Axel）还是勾手三周跳（Triple Lutz）？”或者“这个手术缝合动作是否规范？”，现有的顶级模型往往会瞬间“哑火”。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">最近，来自华盛顿大学、艾伦人工智能研究所（Allen Institute for AI）以及斯坦福大学的研究团队发表了一项非常有意思的研究。他们指出，当前的视频理解模型大多在“感知”层面内卷，却忽略了真正具有挑战性的 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">领域特定（Domain-Specific）</span></strong><span leaf=""> 动作识别。为此，他们推出了一个名为 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">VideoNet</span></strong><span leaf=""> 的大规模数据集。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175688" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2759259259259259" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=5bd32e08&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8K2WsGmiaB9fKDvYiawymlUe8Tm0AG9QN2RDiarlRr9icYcUJjC8Te0z84cCJIkv7MsnSEdrLjFrBKfeOeUj19dGyz1tJicfwPzPfw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2605.02834" target="_blank">https://arxiv.org/abs/2605.02834</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">项目主页</span></b><span leaf="">: <a href="https://tanu.sh/research/videonet" target="_blank">https://tanu.sh/research/videonet</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">代码与数据</span></b><span leaf="">: <a href="https://github.com/RAIVNLab/VideoNet" target="_blank">https://github.com/RAIVNLab/VideoNet</a> (已开源)</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">录用会议</span></b><span leaf="">: CVPR 2026 (Highlight)</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">背景与动机：被遗忘的“硬核”动作识别</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在计算机视觉的早期，识别网球的各种击球动作曾是研究的热点。但随着深度学习的兴起，大家转向了规模更大的通用数据集，如 Kinetics。虽然这些数据集很大，但标签却非常“粗糙”。比如，Kinetics 里可能只有一个“攀岩”标签，但在专业的攀石（Bouldering）领域，动作可以细分为几十种。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">现有的 VLM 评测集虽然开始关注细粒度动作，但往往局限于第一视角，或者场景非常单一。这就导致模型在面对真实世界中复杂、专业的动作时，表现得像个“门外汉”。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">VideoNet 的出现就是为了打破这种局面。它涵盖了从体育竞技、舞蹈艺术到医疗手术、手工艺制作等 </span><b><span leaf="">37 个领域</span></b><span leaf="">，共计 </span><b><span leaf="">1000 种独特动作</span></b><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="VideoNet 涵盖的 7 大类 37 个领域示例" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175691" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.675" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=fc18838a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8fTrymIVURGczzKeTB8yTvPsHHNywMicW8rOaEf6ujWVib4PfoqVGUvlnH4K73SjzAOPPKOiaKXn2KYXfmot5mkhlmYk04poZfAo%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">VideoNet 涵盖的 7 大类 37 个领域示例</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">方法详解：如何教 AI 识别“专家动作”？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">构建这样一个专业的数据集，最大的难点在于：</span><b><span leaf="">去哪里找这么多专家来打标签？</span></b><span leaf=""> 如果让普通众包人员去标“三周半跳”，错误率肯定高得离谱。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 众包流水线：让非专家变身“临时专家”</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了解决这个问题，研究团队设计了一套自动化与人工结合的流水线。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">AI 定义生成</span></b><span leaf="">：首先利用具备联网搜索能力的 LLM（如 Claude-3.7），针对每种动作生成极其详尽的“视觉定义”。这些定义不使用生僻术语，而是用大白话描述动作的视觉特征。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">三阶段标注（Input/Output 流程）</span></b><span leaf="">：</span></p></li><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">采集（Collection）</span></b><span leaf="">：</span><b><span leaf="">输入</span></b><span leaf="">动作名称和定义，众包人员在 Web 端搜寻 7 个候选片段。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">验证（Verification）</span></b><span leaf="">：通过“异常检测”逻辑，多名标注员剔除不符合定义的片段。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">精修（Trimming）</span></b><span leaf="">：</span><b><span leaf="">输出</span></b><span leaf="">最终留下的片段，并进行精确的时间边界裁剪。</span></p></li></ol></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种方法非常高效，专家抽样验证显示，最终标签的准确率高达 </span><font color="#0000FF"><b><span leaf="">97.6%</span></b></font><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="专家验证结果证明了标注流水线的鲁棒性" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175690" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.554641598119859" data-w="851" src="https://wechat2rss.xlab.app/img-proxy/?k=b926d713&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9CyF5ibOPgqImgsanHyz022JABicibd0LXcDEtQCj7LkumOfibOgUGLibAQlBcUuRBWWaaunlNhia3vxnOiaYZamOR44Gwa3HIibqbbpI%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">专家验证结果证明了标注流水线的鲁棒性</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 硬负样本：拒绝“送分题”</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了防止模型通过背景来作弊，作者利用推理模型（如 o3-2025-04-16）生成了“硬负样本（Hard Negatives）”。这些负样本在视觉或运动特征上与正样本极度相似，只有细微差别（例如：空接扣篮 vs 补篮）。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="VideoNet 提供的多选题和少样本二分类两种评测设置" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175692" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.912962962962963" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=f6305dd4&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8SVtILTalFBN9j7LVlJnR3E6bclNUiaznqgmde9VuD6Uoqs6aytjLF76MevGGIkHyFic0mwFATQTzibHyWYj0Cn26o9oQO8V1vP4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">VideoNet 提供的多选题和少样本二分类两种评测设置</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. SingleAction 策略：自动化构建 16 万训练集</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">除了评测集，作者还构建了一个包含 16 万条剪辑的训练集。这里他们提出了一个核心的 </span><font color="#0000FF"><b><span leaf="">SingleAction</span></b></font><span leaf=""> 过滤策略：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">逻辑推演</span></b><span leaf="">：如果一个视频的标题提到了某个动作，且 Gemini 2.5 Flash 定位器在整个视频中</span><b><span leaf="">只发现了一个动作片段</span></b><span leaf="">，那么这个片段必然对应标题所述动作。这种策略极大地提高了自动化标注的纯净度。</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验与结果：小模型的逆袭</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队在 VideoNet 上测试了目前市面上最顶尖的模型，包括 Gemini 3.1 Pro 和 GPT-5 等。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 闭源模型领先，但仍有巨大提升空间</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在多选题（MCQ）设置下，闭源模型的准确率在 70% 左右，而开源的 8B 模型（如 Qwen3-VL, InternVL3.5）仅在 45% 左右徘徊。这说明 VideoNet 对于现有的 VLM 来说极具挑战性。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="多选题评测结果：闭源模型与开源模型之间存在显著差距" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175693" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5925925925925926" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=8b7976ff&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWiceYib0N9OaXTBlbgic9uTjlCjWDmC5bngTkXqAydeQvk0ZHnibRhmz2Np3laMymfmhNUqq3qcZv7Inc2L4zcUe89xxVtysX96FL4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">多选题评测结果：闭源模型与开源模型之间存在显著差距</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 4B 模型微调后反超 8B 标杆</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作者在自家 16 万条数据上微调了一个仅有 4B 参数的 Molmo2 模型。结果显示，微调后的 </span><font color="#0000FF"><b><span leaf="">Molmo2-4B (FT)</span></b></font><span leaf=""> 在多选题任务中提升了 </span><b><span leaf="">11.5%</span></b><span leaf="">，最终准确率达到 </span><b><span leaf="">53.5%</span></b><span leaf="">，一举超过了所有未经过针对性训练的 8B 开源模型。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="不同数据过滤策略的效果对比，SingleAction 表现最强" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175694" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.39537037037037037" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=4b53771f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicDiaicyvjpwlRqwhrZjXJHc9LOuCFQVBsxJ6qZX52UmntvXxUwnnZHZTClsjFbHVIN9BeuQFynuicK4O5ysdCibnwngVEQckIHIPk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">不同数据过滤策略的效果对比，SingleAction 表现最强</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. VLM 是糟糕的“少样本学习者”</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究还发现了一个有趣的现象：人类在看到 3 个视频示例后，准确率能大幅提升 </span><b><span leaf="">13.6%</span></b><span leaf="">；而 VLM 在同样的 </span><span style="cursor:pointer;" data-formula="k"><span data-formula="k"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -694 521 705" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.179ex;height: 1.595ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="6B" d="M121 647Q121 657 125 670T137 683Q138 683 209 688T282 694Q294 694 294 686Q294 679 244 477Q194 279 194 272Q213 282 223 291Q247 309 292 354T362 415Q402 442 438 442Q468 442 485 423T503 369Q503 344 496 327T477 302T456 291T438 288Q418 288 406 299T394 328Q394 353 410 369T442 390L458 393Q446 405 434 405H430Q398 402 367 380T294 316T228 255Q230 254 243 252T267 246T293 238T320 224T342 206T359 180T365 147Q365 130 360 106T354 66Q354 26 381 26Q429 26 459 145Q461 153 479 153H483Q499 153 499 144Q499 139 496 130Q455 -11 378 -11Q333 -11 305 15T277 90Q277 108 280 121T283 145Q283 167 269 183T234 206T200 217T182 220H180Q168 178 159 139T145 81T136 44T129 20T122 7T111 -2Q98 -11 83 -11Q66 -11 57 -1T48 16Q48 26 85 176T158 471L195 616Q196 629 188 632T149 637H144Q134 637 131 637T124 640T121 647Z"></path></g></g></g><g></g></svg></span></span><span leaf="">-shot 设置下，平均仅提升了 </span><b><span leaf="">2.9%</span></b><span leaf="">。这说明目前的视频模型还无法像人类一样，通过几段演示就快速“领悟”一个新动作。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="人类与模型在少样本学习能力上的巨大鸿沟" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175695" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.6268518518518519" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=5dcf41d1&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9smd69jnRhAxEm6gu7E8VELZsvROd5aQC9ov8Volx1dzA5vBFw8zfic3N2VjaXsG1IU1M2BX8zLqXY2w2LzDgTNu4Lw97gxia2M%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">人类与模型在少样本学习能力上的巨大鸿沟</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">此外，消融实验显示，单纯增加采样率（从 1fps 提升至 4fps）带来的收益非常有限，这暗示了模型在</span><b><span leaf="">运动感知（Motion Understanding）</span></b><span leaf="">层面的欠缺，而非简单的信息量不足。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="关于视频输入设置和采样率的消融实验" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175696" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.6481481481481481" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=3af35f96&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8SS1ZPHMYXQFWkzehibRic1BYNqfDT9G1RkBjicYW44jH0YCHpwiauTuhqAUrJ8Bgh4nezvLDSjsqTO5kTs11pXaZBPJjd3MHGzAI%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">关于视频输入设置和采样率的消融实验</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">VideoNet 的发布，反射出当前的视频理解研究现状，也指明了一个新方向。它告诉我们，仅仅靠通用的互联网数据，模型很难真正理解那些需要专业知识的复杂动作。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">另外 4B 模型逆袭 8B 模型，这不仅是算法的胜利，更是数据工程的胜利。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前，VideoNet 的代码和数据已经开源。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175697" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.125" data-w="960" src="https://wechat2rss.xlab.app/img-proxy/?k=14a27214&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW9FSibH3k0dhUB78ftmnicJn90MSibVOOe7SJROWEiaJonk03JicthaG2EC9ec6FEzr5JGkpSmGF1j1vbnG0qk614K41OicnOgwt1GrQ%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175699" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7064814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=897356a3&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9Kf8Geia3bCkqt1WSI5noxiap8JPfKwzfVpk3SjCLrt4v3Eommj51l1EibBASKzjr545KU3DOibJEDbFjjicEGicfdCWk222Wiaib2YFA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=027c670f&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659350%26idx%3D1%26sn%3De92bc2d79ebc6681b01d26179c43905c">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Wed, 06 May 2026 22:30:00 +0800</pubDate>
    </item>
    <item>
      <title>TPAMI 2026 无痛涨点的优化器 DualOpt：一步学习一步复习，刷新 ViT 与 ConvNeXt 多项任务榜单</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659311&amp;idx=1&amp;sn=1a6b1a56ee58fadb4de0edf4c60ace50</link>
      <description>从零训练和微调，不应该使用同一套方案</description>
      <content:encoded><![CDATA[<p><span>CV君</span> <span>2026-05-04 11:40</span> <span style="display: inline-block;">山东</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=a3784036&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGWibia8CB1suo6sJ8gsjCcwSaTjy0ub7IV0aWwIg1MTdLDHU8GicAk5W1IwJHZcphltFoVlVz77ICtiaicoH3qqib2taXfAYqCsddGpGk%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>从零训练和微调，不应该使用同一套方案</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175649" data-ratio="0.2778649921507064" data-type="gif" data-w="637" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=e540e3cd&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGW8zNF1e4iaqnI9Kg1D2M2DKic5CJ3QxLvAU7iciaLy2PicoPQ52vmv6OeU6eiav0jpHl5tibhfhv84bW0d3icvm1Sg77H6kDyKZhnpnTxU%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在深度学习的日常实践中，我们通常会面临两种选择：要么从零开始（From Scratch）训练一个模型，要么拿现成的预训练权重进行微调（Fine-tuning）。虽然这两种范式的目标不同，但大家往往都习惯性地套用相同的优化器，比如 Adam 或 SGD。然而，这种“一刀切”的做法真的最优吗？</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">近日，来自中国科学院、南洋理工大学、国防科技大学、中国科学技术大学等机构的研究者们在顶级期刊 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">IEEE TPAMI</span></strong><span leaf=""> 上发表了一项最新研究，提出了一种名为 </span><b><span leaf="">DualOpt</span></b><span leaf=""> 的新型优化框架，其核心思想是针对“从零训练”和“微调”这两种截然不同的任务需求，提供解耦的优化策略。它不仅能让模型在从零训练时收敛得更快、更稳，还能在微调时有效缓解“灾难性遗忘”问题。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.21666666666666667" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175648" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=cd88b6fc&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWib9j5ia6eHcBzLnlOS0utkW4SE3Aw9fSU00JH0j0E2WG2ib5RIz33DZxhoGzRPCAzwkcI9alDZawf2nVvGsCqT2RZDeo7GctvFk4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2604.22838" target="_blank">https://arxiv.org/abs/2604.22838</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">主要机构</span></b><span leaf="">: 中国科学院、南洋理工大学、中国科学技术大学、蒙特利尔学习算法研究所（Mila – Quebec AI Institute）、国防科技大学</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">代码仓库</span></b><span leaf="">: <a href="https://github.com/qklee-lz/OLOR-AAAI-2024" target="_blank">https://github.com/qklee-lz/OLOR-AAAI-2024</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">录用信息</span></b><span leaf="">: TPAMI 2026</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">背景与动机：为什么优化器需要“解耦”？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">传统的优化器如随机梯度下降（Stochastic Gradient Descent, SGD）和自适应矩估计（Adaptive Moment Estimation, Adam），其设计初衷主要是为了最小化损失函数。但在实际应用中，从零训练和微调的“痛点”完全不同：</span></p><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">从零训练</span></b><span leaf="">：参数随机初始化，重点在于如何快速收敛并获得良好的泛化能力。现有的权重衰减（Weight Decay）机制虽然能防止过拟合，但作者在理论上证明了，在某些更新步中，它可能会意外地增加权重幅度，反而削弱了正则化效果。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">微调</span></b><span leaf="">：模型已经具备了上游任务的通用知识。此时，优化器的挑战在于如何在学习新任务的同时，不把老知识丢掉（即缓解知识遗忘）。</span></p></li></ol><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">DualOpt 的出现，正是为了打破这种统一优化的局限性，通过一套框架、两套逻辑，精准解决上述问题。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="DualOpt 框架总览。它集成了用于微调的权重回退机制和用于从零训练的逐层权重衰减。" class="rich_pages wxw-img" data-ratio="0.9882629107981221" data-type="png" data-w="852" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175647" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=0993bb40&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibD7MW4OicibBxtoeDxNEstvs08l7wGk6zyHXGLUib4EEDiascr1iaPXr9wvcGKiaYiaZOgPAxCGNuUibrkiaaWHQbkJov5fYPian3rRpKfs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">DualOpt 框架总览。它集成了用于微调的权重回退机制和用于从零训练的逐层权重衰减。</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">方法详解：因地制宜的优化策略</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">DualOpt 将优化路径分为两条：针对从零训练的“实时逐层权重衰减”和针对微调的“权重回退与逐层惩罚”。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 从零训练：实时逐层权重衰减（Real-Time Layer-Wise Weight Decay）</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作者首先指出，传统的权重衰减往往滞后于参数更新。标准的更新公式为 </span><span style="cursor:pointer;" data-formula="\theta_{t+1} = \theta_t - \eta_t U^g_t - \lambda \theta_t"><span data-formula="\theta_{t+1} = \theta_t - \eta_t U^g_t - \lambda \theta_t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -811.1 9611.3 1087.9" aria-hidden="true" style="vertical-align: -0.626ex;width: 21.745ex;height: 2.461ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="TeXAtom" transform="translate(469, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mn" transform="translate(1139, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g><g data-mml-node="mo" transform="translate(1955.7, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msub" transform="translate(3011.5, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mi" transform="translate(469, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(4008, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="msub" transform="translate(5008.2, 0)"><g data-mml-node="mi"><path data-c="3B7" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q156 442 175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336V326Q503 302 439 53Q381 -182 377 -189Q364 -216 332 -216Q319 -216 310 -208T299 -186Q299 -177 358 57L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(497, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="msubsup" transform="translate(5810.5, 0)"><g data-mml-node="mi"><path data-c="55" d="M107 637Q73 637 71 641Q70 643 70 649Q70 673 81 682Q83 683 98 683Q139 681 234 681Q268 681 297 681T342 682T362 682Q378 682 378 672Q378 670 376 658Q371 641 366 638H364Q362 638 359 638T352 638T343 637T334 637Q295 636 284 634T266 623Q265 621 238 518T184 302T154 169Q152 155 152 140Q152 86 183 55T269 24Q336 24 403 69T501 205L552 406Q599 598 599 606Q599 633 535 637Q511 637 511 648Q511 650 513 660Q517 676 519 679T529 683Q532 683 561 682T645 680Q696 680 723 681T752 682Q767 682 767 672Q767 650 759 642Q756 637 737 637Q666 633 648 597Q646 592 598 404Q557 235 548 205Q515 105 433 42T263 -22Q171 -22 116 34T60 167V183Q60 201 115 421Q164 622 164 628Q164 635 107 637Z"></path></g><g data-mml-node="mi" transform="translate(833.8, 498.6) scale(0.707)"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g><g data-mml-node="mi" transform="translate(683, -269) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(7253.8, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mi" transform="translate(8254, 0)"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="msub" transform="translate(8837, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mi" transform="translate(469, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">。作者通过数学推导发现，当满足以下条件时：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\begin{cases} \eta_t U^g_t &lt; (1 - \frac{\lambda}{2})\theta_t, &amp; \text{if } \theta_t &lt; 0 \\ \eta_t U^g_t &gt; (1 - \frac{\lambda}{2})\theta_t, &amp; \text{if } \theta_t &gt; 0 \end{cases}
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1579.7 12953.7 2659.5" aria-hidden="true" style="max-width: 300%;vertical-align: -2.443ex;width: 29.307ex;height: 6.017ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mrow"><g data-mml-node="mo"><path data-c="7B" d="M618 -943L612 -949H582L568 -943Q472 -903 411 -841T332 -703Q327 -682 327 -653T325 -350Q324 -28 323 -18Q317 24 301 61T264 124T221 171T179 205T147 225T132 234Q130 238 130 250Q130 255 130 258T131 264T132 267T134 269T139 272T144 275Q207 308 256 367Q310 436 323 519Q324 529 325 851Q326 1124 326 1154T332 1205Q369 1358 566 1443L582 1450H612L618 1444V1429Q618 1413 616 1411L608 1406Q599 1402 585 1393T552 1372T515 1343T479 1305T449 1257T429 1200Q425 1180 425 1152T423 851Q422 579 422 549T416 498Q407 459 388 424T346 364T297 318T250 284T214 264T197 254L188 251L205 242Q290 200 345 138T416 3Q421 -18 421 -48T423 -349Q423 -397 423 -472Q424 -677 428 -694Q429 -697 429 -699Q434 -722 443 -743T465 -782T491 -816T519 -845T548 -868T574 -886T595 -899T610 -908L616 -910Q618 -912 618 -928V-943Z"></path></g><g data-mml-node="mtable" transform="translate(750, 0)"><g data-mml-node="mtr" transform="translate(0, 695)"><g data-mml-node="mtd"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B7" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q156 442 175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336V326Q503 302 439 53Q381 -182 377 -189Q364 -216 332 -216Q319 -216 310 -208T299 -186Q299 -177 358 57L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(497, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="msubsup" transform="translate(802.3, 0)"><g data-mml-node="mi"><path data-c="55" d="M107 637Q73 637 71 641Q70 643 70 649Q70 673 81 682Q83 683 98 683Q139 681 234 681Q268 681 297 681T342 682T362 682Q378 682 378 672Q378 670 376 658Q371 641 366 638H364Q362 638 359 638T352 638T343 637T334 637Q295 636 284 634T266 623Q265 621 238 518T184 302T154 169Q152 155 152 140Q152 86 183 55T269 24Q336 24 403 69T501 205L552 406Q599 598 599 606Q599 633 535 637Q511 637 511 648Q511 650 513 660Q517 676 519 679T529 683Q532 683 561 682T645 680Q696 680 723 681T752 682Q767 682 767 672Q767 650 759 642Q756 637 737 637Q666 633 648 597Q646 592 598 404Q557 235 548 205Q515 105 433 42T263 -22Q171 -22 116 34T60 167V183Q60 201 115 421Q164 622 164 628Q164 635 107 637Z"></path></g><g data-mml-node="mi" transform="translate(833.8, 498.6) scale(0.707)"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g><g data-mml-node="mi" transform="translate(683, -269) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(2301.1, 0)"><path data-c="3C" d="M694 -11T694 -19T688 -33T678 -40Q671 -40 524 29T234 166L90 235Q83 240 83 250Q83 261 91 266Q664 540 678 540Q681 540 687 534T694 519T687 505Q686 504 417 376L151 250L417 124Q686 -4 687 -5Q694 -11 694 -19Z"></path></g><g data-mml-node="mo" transform="translate(3356.9, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mn" transform="translate(3745.9, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(4468.1, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mfrac" transform="translate(5468.4, 0)"><g data-mml-node="mi" transform="translate(220, 394) scale(0.707)"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mn" transform="translate(249.3, -345) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><rect width="612.2" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(6320.6, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="msub" transform="translate(6709.6, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mi" transform="translate(469, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(7483.9, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g><g data-mml-node="mtd" transform="translate(8761.9, 0)"><g data-mml-node="mtext"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path><path data-c="66" d="M273 0Q255 3 146 3Q43 3 34 0H26V46H42Q70 46 91 49Q99 52 103 60Q104 62 104 224V385H33V431H104V497L105 564L107 574Q126 639 171 668T266 704Q267 704 275 704T289 705Q330 702 351 679T372 627Q372 604 358 590T321 576T284 590T270 627Q270 647 288 667H284Q280 668 273 668Q245 668 223 647T189 592Q183 572 182 497V431H293V385H185V225Q185 63 186 61T189 57T194 54T199 51T206 49T213 48T222 47T231 47T241 46T251 46H282V0H273Z" transform="translate(278, 0)"></path><path data-c="A0" d="" transform="translate(584, 0)"></path></g><g data-mml-node="msub" transform="translate(834, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mi" transform="translate(469, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1886, 0)"><path data-c="3C" d="M694 -11T694 -19T688 -33T678 -40Q671 -40 524 29T234 166L90 235Q83 240 83 250Q83 261 91 266Q664 540 678 540Q681 540 687 534T694 519T687 505Q686 504 417 376L151 250L417 124Q686 -4 687 -5Q694 -11 694 -19Z"></path></g><g data-mml-node="mn" transform="translate(2941.8, 0)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g><g data-mml-node="mtr" transform="translate(0, -734.7)"><g data-mml-node="mtd"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B7" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q156 442 175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336V326Q503 302 439 53Q381 -182 377 -189Q364 -216 332 -216Q319 -216 310 -208T299 -186Q299 -177 358 57L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(497, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="msubsup" transform="translate(802.3, 0)"><g data-mml-node="mi"><path data-c="55" d="M107 637Q73 637 71 641Q70 643 70 649Q70 673 81 682Q83 683 98 683Q139 681 234 681Q268 681 297 681T342 682T362 682Q378 682 378 672Q378 670 376 658Q371 641 366 638H364Q362 638 359 638T352 638T343 637T334 637Q295 636 284 634T266 623Q265 621 238 518T184 302T154 169Q152 155 152 140Q152 86 183 55T269 24Q336 24 403 69T501 205L552 406Q599 598 599 606Q599 633 535 637Q511 637 511 648Q511 650 513 660Q517 676 519 679T529 683Q532 683 561 682T645 680Q696 680 723 681T752 682Q767 682 767 672Q767 650 759 642Q756 637 737 637Q666 633 648 597Q646 592 598 404Q557 235 548 205Q515 105 433 42T263 -22Q171 -22 116 34T60 167V183Q60 201 115 421Q164 622 164 628Q164 635 107 637Z"></path></g><g data-mml-node="mi" transform="translate(833.8, 498.6) scale(0.707)"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g><g data-mml-node="mi" transform="translate(683, -269) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(2301.1, 0)"><path data-c="3E" d="M84 520Q84 528 88 533T96 539L99 540Q106 540 253 471T544 334L687 265Q694 260 694 250T687 235Q685 233 395 96L107 -40H101Q83 -38 83 -20Q83 -19 83 -17Q82 -10 98 -1Q117 9 248 71Q326 108 378 132L626 250L378 368Q90 504 86 509Q84 513 84 520Z"></path></g><g data-mml-node="mo" transform="translate(3356.9, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mn" transform="translate(3745.9, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(4468.1, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mfrac" transform="translate(5468.4, 0)"><g data-mml-node="mi" transform="translate(220, 394) scale(0.707)"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mn" transform="translate(249.3, -345) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><rect width="612.2" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(6320.6, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="msub" transform="translate(6709.6, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mi" transform="translate(469, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(7483.9, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g><g data-mml-node="mtd" transform="translate(8761.9, 0)"><g data-mml-node="mtext"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path><path data-c="66" d="M273 0Q255 3 146 3Q43 3 34 0H26V46H42Q70 46 91 49Q99 52 103 60Q104 62 104 224V385H33V431H104V497L105 564L107 574Q126 639 171 668T266 704Q267 704 275 704T289 705Q330 702 351 679T372 627Q372 604 358 590T321 576T284 590T270 627Q270 647 288 667H284Q280 668 273 668Q245 668 223 647T189 592Q183 572 182 497V431H293V385H185V225Q185 63 186 61T189 57T194 54T199 51T206 49T213 48T222 47T231 47T241 46T251 46H282V0H273Z" transform="translate(278, 0)"></path><path data-c="A0" d="" transform="translate(584, 0)"></path></g><g data-mml-node="msub" transform="translate(834, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mi" transform="translate(469, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(1886, 0)"><path data-c="3E" d="M84 520Q84 528 88 533T96 539L99 540Q106 540 253 471T544 334L687 265Q694 260 694 250T687 235Q685 233 395 96L107 -40H101Q83 -38 83 -20Q83 -19 83 -17Q82 -10 98 -1Q117 9 248 71Q326 108 378 132L626 250L378 368Q90 504 86 509Q84 513 84 520Z"></path></g><g data-mml-node="mn" transform="translate(2941.8, 0)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g></g><g data-mml-node="mo" transform="translate(12953.7, 0)"></g></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">权重的绝对值反而会增加，这违背了正则化的初衷。为了解决这个问题，DualOpt 引入了</span><b><span leaf="">实时权重衰减</span></b><span leaf="">，直接对更新后的临时权重进行衰减：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\theta_{t+1} = \theta_{t} - \eta_{t}U_{g}^{t} - \lambda(\theta_{t} - \eta_{t}U_{g}^{t})
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -855.6 13471 1247.6" aria-hidden="true" style="max-width: 300%;vertical-align: -0.887ex;width: 30.477ex;height: 2.823ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="TeXAtom" transform="translate(469, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mn" transform="translate(1139, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g><g data-mml-node="mo" transform="translate(1955.7, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msub" transform="translate(3011.5, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="TeXAtom" transform="translate(469, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g data-mml-node="mo" transform="translate(4008, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="msub" transform="translate(5008.2, 0)"><g data-mml-node="mi"><path data-c="3B7" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q156 442 175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336V326Q503 302 439 53Q381 -182 377 -189Q364 -216 332 -216Q319 -216 310 -208T299 -186Q299 -177 358 57L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="TeXAtom" transform="translate(497, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g data-mml-node="msubsup" transform="translate(5810.5, 0)"><g data-mml-node="mi"><path data-c="55" d="M107 637Q73 637 71 641Q70 643 70 649Q70 673 81 682Q83 683 98 683Q139 681 234 681Q268 681 297 681T342 682T362 682Q378 682 378 672Q378 670 376 658Q371 641 366 638H364Q362 638 359 638T352 638T343 637T334 637Q295 636 284 634T266 623Q265 621 238 518T184 302T154 169Q152 155 152 140Q152 86 183 55T269 24Q336 24 403 69T501 205L552 406Q599 598 599 606Q599 633 535 637Q511 637 511 648Q511 650 513 660Q517 676 519 679T529 683Q532 683 561 682T645 680Q696 680 723 681T752 682Q767 682 767 672Q767 650 759 642Q756 637 737 637Q666 633 648 597Q646 592 598 404Q557 235 548 205Q515 105 433 42T263 -22Q171 -22 116 34T60 167V183Q60 201 115 421Q164 622 164 628Q164 635 107 637Z"></path></g><g data-mml-node="TeXAtom" transform="translate(833.8, 413) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(683, -247) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g></g></g><g data-mml-node="mo" transform="translate(7171.8, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mi" transform="translate(8172, 0)"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mo" transform="translate(8755, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(9144, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="TeXAtom" transform="translate(469, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g data-mml-node="mo" transform="translate(10140.5, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="msub" transform="translate(11140.7, 0)"><g data-mml-node="mi"><path data-c="3B7" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q156 442 175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336V326Q503 302 439 53Q381 -182 377 -189Q364 -216 332 -216Q319 -216 310 -208T299 -186Q299 -177 358 57L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="TeXAtom" transform="translate(497, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g data-mml-node="msubsup" transform="translate(11943, 0)"><g data-mml-node="mi"><path data-c="55" d="M107 637Q73 637 71 641Q70 643 70 649Q70 673 81 682Q83 683 98 683Q139 681 234 681Q268 681 297 681T342 682T362 682Q378 682 378 672Q378 670 376 658Q371 641 366 638H364Q362 638 359 638T352 638T343 637T334 637Q295 636 284 634T266 623Q265 621 238 518T184 302T154 169Q152 155 152 140Q152 86 183 55T269 24Q336 24 403 69T501 205L552 406Q599 598 599 606Q599 633 535 637Q511 637 511 648Q511 650 513 660Q517 676 519 679T529 683Q532 683 561 682T645 680Q696 680 723 681T752 682Q767 682 767 672Q767 650 759 642Q756 637 737 637Q666 633 648 597Q646 592 598 404Q557 235 548 205Q515 105 433 42T263 -22Q171 -22 116 34T60 167V183Q60 201 115 421Q164 622 164 628Q164 635 107 637Z"></path></g><g data-mml-node="TeXAtom" transform="translate(833.8, 413) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(683, -247) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g></g></g><g data-mml-node="mo" transform="translate(13082, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这样可以确保在任何 </span><span style="cursor:pointer;" data-formula="\lambda \in (0, 1]"><span data-formula="\lambda \in (0, 1]"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 3917.2 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 8.862ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mo" transform="translate(860.8, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="mo" transform="translate(1805.6, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mn" transform="translate(2194.6, 0)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g><g data-mml-node="mo" transform="translate(2694.6, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mn" transform="translate(3139.2, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(3639.2, 0)"><path data-c="5D" d="M22 710V750H159V-250H22V-210H119V710H22Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 的情况下，权重都会被有效地向零拉拢。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">更巧妙的是，它考虑到了神经网络的层级特性。浅层网络通常捕捉颜色、边缘等基础特征，过拟合风险低；而深层网络捕捉复杂的语义特征，更容易过拟合。因此，DualOpt 采用了</span><b><span leaf="">逐层权重衰减率</span></b><span style="cursor:pointer;" data-formula="\lambda_i"><span data-formula="\lambda_i"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -694 877 851.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 1.984ex;height: 1.927ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mi" transform="translate(583, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\lambda_i = \lambda \frac{i}{n}
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1337 3833.5 2034" aria-hidden="true" style="max-width: 300%;vertical-align: -1.577ex;width: 8.673ex;height: 4.602ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mi" transform="translate(583, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(1154.7, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mi" transform="translate(2210.5, 0)"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mfrac" transform="translate(2793.5, 0)"><g data-mml-node="mi" transform="translate(347.5, 676)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(220, -686)"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g><rect width="800" height="60" x="120" y="220"></rect></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中 </span><span style="cursor:pointer;" data-formula="i"><span data-formula="i"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -661 345 672" aria-hidden="true" style="vertical-align: -0.025ex;width: 0.781ex;height: 1.52ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 是当前层数，</span><span style="cursor:pointer;" data-formula="n"><span data-formula="n"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 600 453" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.357ex;height: 1.025ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 是总层数。这意味着越往深层，衰减力度越大，从而在保证收敛速度的同时，提升了模型的泛化性能。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="DualOpt 优化框架流程图。顶部路径处理从零训练，底部路径处理微调。" class="rich_pages wxw-img" data-ratio="0.4648148148148148" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175650" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=c2b3ff8b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8KZXXnGwumQicOWXKIbCDT1rMiafP6gibojEaibn6HFsiacaMGztWBOWBHJ5cByOiaoibGOLTsS19OHAXn7Ep1DX0k6dzBw7zsVnZyzs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">DualOpt 优化框架流程图。顶部路径处理从零训练，底部路径处理微调。</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 微调：权重回退机制（Weight Rollback）</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这是 DualOpt 最具创新的部分。在微调过程中，它在每次更新步中加入了一个“回退项”，将当前的权重稍微向预训练权重 </span><span style="cursor:pointer;" data-formula="\theta_0"><span data-formula="\theta_0"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 872.6 870.6" aria-hidden="true" style="vertical-align: -0.375ex;width: 1.974ex;height: 1.97ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mn" transform="translate(469, -150) scale(0.707)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 方向“拉”一把。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><b><span leaf="">输入输出流程</span></b><span leaf="">：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">输入</span></b><span leaf="">：当前权重 </span><span style="cursor:pointer;" data-formula="\theta_t"><span data-formula="\theta_t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 774.3 862.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 1.752ex;height: 1.952ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mi" transform="translate(469, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">、梯度 </span><span style="cursor:pointer;" data-formula="g_t"><span data-formula="g_t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 782.3 647" aria-hidden="true" style="vertical-align: -0.464ex;width: 1.77ex;height: 1.464ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g><g data-mml-node="mi" transform="translate(477, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">、预训练权重 </span><span style="cursor:pointer;" data-formula="\theta_0"><span data-formula="\theta_0"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 872.6 870.6" aria-hidden="true" style="vertical-align: -0.375ex;width: 1.974ex;height: 1.97ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mn" transform="translate(469, -150) scale(0.707)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">、差异值 </span><span style="cursor:pointer;" data-formula="d_t"><span data-formula="d_t"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -694 825.3 851.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 1.867ex;height: 1.927ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="64" d="M366 683Q367 683 438 688T511 694Q523 694 523 686Q523 679 450 384T375 83T374 68Q374 26 402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487H491Q506 153 506 145Q506 140 503 129Q490 79 473 48T445 8T417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157Q33 205 53 255T101 341Q148 398 195 420T280 442Q336 442 364 400Q369 394 369 396Q370 400 396 505T424 616Q424 629 417 632T378 637H357Q351 643 351 645T353 664Q358 683 366 683ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g><g data-mml-node="mi" transform="translate(520, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">逻辑</span></b><span leaf="">：优化器首先计算梯度更新，然后计算当前权重与 </span><span style="cursor:pointer;" data-formula="\theta_0"><span data-formula="\theta_0"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 872.6 870.6" aria-hidden="true" style="vertical-align: -0.375ex;width: 1.974ex;height: 1.97ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mn" transform="translate(469, -150) scale(0.707)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 的偏差。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">更新公式</span></b><span leaf="">：</span><span style="cursor:pointer;" data-formula="\theta_{t+1} = (1 - \lambda)(\theta_{t} - \eta_t g_t) + \lambda \theta_0"><span data-formula="\theta_{t+1} = (1 - \lambda)(\theta_{t} - \eta_t g_t) + \lambda \theta_0"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 13132.2 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 29.711ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="TeXAtom" transform="translate(469, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mn" transform="translate(1139, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g><g data-mml-node="mo" transform="translate(1955.7, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(3011.5, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mn" transform="translate(3400.5, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(4122.7, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mi" transform="translate(5122.9, 0)"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mo" transform="translate(5705.9, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(6094.9, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(6483.9, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="TeXAtom" transform="translate(469, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g><g data-mml-node="mo" transform="translate(7480.4, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="msub" transform="translate(8480.7, 0)"><g data-mml-node="mi"><path data-c="3B7" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q156 442 175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336V326Q503 302 439 53Q381 -182 377 -189Q364 -216 332 -216Q319 -216 310 -208T299 -186Q299 -177 358 57L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(497, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="msub" transform="translate(9282.9, 0)"><g data-mml-node="mi"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g><g data-mml-node="mi" transform="translate(477, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(10065.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(10676.4, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mi" transform="translate(11676.6, 0)"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="msub" transform="translate(12259.6, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="mn" transform="translate(469, -150) scale(0.707)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">输出</span></b><span leaf="">：更新后的权重 </span><span style="cursor:pointer;" data-formula="\theta_{t+1}"><span data-formula="\theta_{t+1}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 1677.9 913" aria-hidden="true" style="vertical-align: -0.471ex;width: 3.796ex;height: 2.066ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="TeXAtom" transform="translate(469, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mn" transform="translate(1139, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 以及更新后的差异值 </span><span style="cursor:pointer;" data-formula="d_{t+1}"><span data-formula="d_{t+1}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -694 1728.9 902" aria-hidden="true" style="vertical-align: -0.471ex;width: 3.912ex;height: 2.041ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="64" d="M366 683Q367 683 438 688T511 694Q523 694 523 686Q523 679 450 384T375 83T374 68Q374 26 402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487H491Q506 153 506 145Q506 140 503 129Q490 79 473 48T445 8T417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157Q33 205 53 255T101 341Q148 398 195 420T280 442Q336 442 364 400Q369 394 369 396Q370 400 396 505T424 616Q424 629 417 632T378 637H357Q351 643 351 645T353 664Q358 683 366 683ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g><g data-mml-node="TeXAtom" transform="translate(520, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mn" transform="translate(1139, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种设计就像是“一步学习，一步复习”，确保模型在适应新任务的同时，其权重分布不会偏离预训练状态太远。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">此外，针对微调，DualOpt 还设计了</span><b><span leaf="">逐层惩罚（Layer-wise Penalty）</span></b><span leaf="">。由于浅层特征更具通用性，DualOpt 会通过参数 </span><span style="cursor:pointer;" data-formula="\gamma"><span data-formula="\gamma"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -441 543 657" aria-hidden="true" style="vertical-align: -0.489ex;width: 1.229ex;height: 1.486ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3B3" d="M31 249Q11 249 11 258Q11 275 26 304T66 365T129 418T206 441Q233 441 239 440Q287 429 318 386T371 255Q385 195 385 170Q385 166 386 166L398 193Q418 244 443 300T486 391T508 430Q510 431 524 431H537Q543 425 543 422Q543 418 522 378T463 251T391 71Q385 55 378 6T357 -100Q341 -165 330 -190T303 -216Q286 -216 286 -188Q286 -138 340 32L346 51L347 69Q348 79 348 100Q348 257 291 317Q251 355 196 355Q148 355 108 329T51 260Q49 251 47 251Q45 249 31 249Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 调节惩罚力度，给浅层施加更强的回退惩罚，以保留通用知识；而深层则给予更多自由度去适配新任务。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="微调模式下的 Adam 优化器算法流程，展示了权重回退与差异更新的细节。" class="rich_pages wxw-img" data-ratio="0.9159763313609467" data-type="png" data-w="845" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175651" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=49cc450f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW92DZibboOMSXsslNjlm7HazXibQzRd0GlicAYkBQvPBGQM3VDgjf0FMw1SauoTFI2yAzH7jP2ctxYNBvOBgic1ticmnJmJBAgTfjQs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">微调模式下的 Adam 优化器算法流程，展示了权重回退与差异更新的细节。</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验与结果：全方位的性能碾压</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队在图像分类、目标检测、语义分割等 10 个主流数据集上进行了严苛的测试，涵盖了 ResNet、Inception、ConvNeXt 和 ViT 等多种主流骨干网络。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 分类任务：全面超越 SOTA</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在微调实验中，DualOpt 展现了惊人的爆发力。以 ViT-B 为例，在挑战性极高的跨域数据集 PACS 上，DualOpt 将准确率从基线的 87.79% 提升到了 </span><font color="#0000FF"><b><span leaf="">94.38%</span></b></font><span leaf="">。在 CIFAR-100 上，它也比传统的 Full Fine-tuning 提升了约 5.13 个百分点。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="微调任务结果对比。可以看到 DualOpt 在各种数据集上均取得了最优表现。" class="rich_pages wxw-img" data-ratio="0.4425925925925926" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175656" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=81c47ab2&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8GQ7wwOhekx3tzOcZNMVj03Oeuc2OCx6a5D0lXHHXqwVTib3ZdyuVtFLicVs7DdXh1WHKB3aic2ia2mhKv3AObwweUYmP33YHWiaTU%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">微调任务结果对比。可以看到 DualOpt 在各种数据集上均取得了最优表现。</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在大规模数据集 ImageNet 上，DualOpt 同样表现出色。对于 ViT-B 模型，它将 Top-1 准确率从 81.34% 提升至 </span><font color="#0000FF"><b><span leaf="">82.58%</span></b></font><span leaf="">；对于 Swin-B 模型，则从 83.05% 提升至 </span><font color="#0000FF"><b><span leaf="">83.89%</span></b></font><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.4668911335578002" data-type="png" data-w="891" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175653" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=d58da415&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWib3nkhGZqPDbrTCkz04nbm2Gabj0IMw60Nniau88hzfKaRbV5ngnh248YCZkT1CtAzGpiaohluR6xnxMH4P1jrDt06bYILK89IuY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 检测与分割：通用性极强</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">DualOpt 并不局限于分类。在 COCO2017 目标检测任务中，使用 Mask R-CNN 作为基准，DualOpt 将 Bbox mAP 从 40.20% 提升至 </span><font color="#0000FF"><b><span leaf="">41.10%</span></b></font><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.3305526590198123" data-type="png" data-w="959" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175652" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=e33fdd21&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibVv55qqiatKZKCPpdAHEbosyTXGAsUibicvTLv6URVJ4jicEiaTjpMgZZccYzV8d9Rs8Nlic2N8A3iaiau2DiacgibB1ylVBpokicFVBvAd0%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在 ADE20K 语义分割任务中，使用 UperNet 配合 ViT-B 后，mIoU 也提升了近 1 个百分点，达到 </span><font color="#0000FF"><b><span leaf="">44.62%</span></b></font><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.27579162410623087" data-type="png" data-w="979" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175654" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=689c8406&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibsOxYtCTWQ4cvhKedk9XDNH6fbswIcrB91vaTK86L9rTx0NTl1T9NVVoogSEeib1f6iaia871bPEOD0kpSciaZOjA59tVvw8HKgIA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 效率分析：极低的额外开销</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作为一个优化器层面的改进，大家最关心的往往是计算成本。实验显示，DualOpt 相比于全量微调，在 ViT-B 上仅增加了约 </span><font color="#0000FF"><b><span leaf="">0.04%</span></b></font><span leaf=""> 的计算开销（FLOPs），显存占用（Mem）也几乎持平。这意味着你几乎可以“无痛获得”这些性能提升。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="方法效率对比表。DualOpt 在保持高性能的同时，计算开销极小。" class="rich_pages wxw-img" data-ratio="0.30462962962962964" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175655" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=aa997148&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibcNOJv9micPzpFGkyaxGrMft0k1jjNUFHoVRTTrmuwaVib8uhuE3ne6Wm5Omg110bUvxrQBTZ1z4Tw1SaBnzUZVEIkv7um4rzf8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">方法效率对比表。DualOpt 在保持高性能的同时，计算开销极小。</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">4. 可视化分析：特征边界更清晰</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">通过 t-SNE 可视化可以发现，DualOpt 学习到的特征分布具有更小的类内距离和更大的类间距离。相比于 Linear Probing 或 Full Fine-tuning，DualOpt 的特征簇边界非常清晰，这直接解释了其高准确率的原因。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="PACS 数据集上的 t-SNE 可视化。DualOpt 的特征分离度明显优于其他方法。" class="rich_pages wxw-img" data-ratio="0.27314814814814814" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175658" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=911b1095&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8ufP0U752DtG9mfHm5GficXQL8O8nXqH3RG3GCkZicibcQFSP9ia3QzfK0ZibIcFy4JmOtEjUXAVHC0zh1chco72E5rAWxSicfiajtA0%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">PACS 数据集上的 t-SNE 可视化。DualOpt 的特征分离度明显优于其他方法。</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">DualOpt 的成功告诉我们，深度学习的进步不仅来自于更深的网络或更大的数据，对底层优化机制的“精雕细琢”同样能带来显著的红利。它通过简单的数学推导和对网络结构的深刻理解，进一步缓解了训练范式中的不匹配问题。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">“一步学习，一步复习”</span></strong><span leaf="">的逻辑，不仅在视觉任务中大放异彩，其背后的解耦思想对于大语言模型（LLM）的持续学习、指令微调等领域同样具有继续探索的启发意义。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.125" data-type="gif" data-w="960" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-imgfileid="100175659" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=3f765d0c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW83SXibZeGjriawl2iaLic89mAkvFI5t44BYCJqFXzYbKOqszY4SZ7cGF52Y7Aa9PFiaiaLQpteehPJib4YdtdYP3JeqxXovgD96R16SI%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-ratio="0.7064814814814815" data-type="png" data-w="1080" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-imgfileid="100175657" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=5885df8c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWic8jz3Ecpco0ICdpaDKDqtwmNnicFUbVIqBK9nUQIsIiaibaVBasMS2Nia3aZsmVaeD3WonTmEN1oycs1Y5OFIPe0oia06tZiaxyCjf0%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></p></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=287c228a&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659311%26idx%3D1%26sn%3D1a6b1a56ee58fadb4de0edf4c60ace50">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 04 May 2026 11:40:00 +0800</pubDate>
    </item>
    <item>
      <title>TPAMI 2026 | 基础架构优化，中科院等提出 EVT：为ViT引入欧几里得距离衰减，建模视觉空间先验</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659310&amp;idx=1&amp;sn=4f86aaacd82e2bbb04ce95b3cc0d537e</link>
      <description>让 ViT 更有“空间感”， ImageNet-1k上 top1 精度86.6%</description>
      <content:encoded><![CDATA[<p><span>CV君</span> <span>2026-05-03 23:12</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=d026c153&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGW9kw3sqeibqvzs8LUApCyaibgicl1Q8L3EtBSvxkHj35TBUsujbHdiaDyVXB9Fu6IwRnHrsdG31c9mR1BuIx4BFiczfL3WibqqnxXzwI%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>让 ViT 更有“空间感”， ImageNet-1k上 top1 精度86.6%</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175631" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2778649921507064" data-w="637" src="https://wechat2rss.xlab.app/img-proxy/?k=732c482c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW8awn2xgHD6a4JOtAvvR8T7o5CJoiblGtd11uTdkXY2rvI87IqkNEnYib5ucy0YMs3vJWhNoIn0emGe7E8zfbia2JdxrVAZPYr8qk%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在计算机视觉领域，Vision Transformer（ViT）的出现无疑是一场变革。然而，尽管它在捕捉全局依赖方面表现出色，但相比于传统的卷积神经网络（CNN），它在某种程度上“缺乏常识”——也就是我们常说的空间先验（Spatial Priors）。此外，自注意力机制那随分辨率平方增长的计算复杂度，也让它在处理高分辨率图像时显得有些吃力。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了解决这些问题，中国科学院与北京科技大学的研究团队在之前 RMT 模型的基础上，推出了一款增强版架构：</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">EVT</span></strong><span leaf="">。该模型全称为 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Euclidean enhanced Vision Transformer</span></strong><span leaf="">，意为“欧几里得增强视觉 Transformer”。作者之所以起这个名字，核心在于它引入了更符合人类视觉特性的“欧几里得距离衰减”来提供空间先验，并配合一种极其灵活的 1D 标记分组策略，实现了性能与效率的双重飞跃。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175628" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.1814814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=da8c26f5&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9xNnxYm50gibHiaSZGjdsIotS1LxP6faptUfpLaTiaLG6Bz49g33TCVATSLQmLVZCgUVoRFlzGr2QMDN16rvhroJicEGxnDtSKdj8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2604.18549" target="_blank">https://arxiv.org/abs/2604.18549</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">录用情况</span></b><span leaf="">: TPAMI 2026</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">背景与动机：从“方格子”到“圆周率”</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在探讨 EVT 之前，我们不得不提它的前作 RMT。RMT 曾尝试通过“曼哈顿距离（Manhattan distance）”来引入空间衰减，即让模型在计算注意力时，距离越远的标记权重越小。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">但研究团队发现，曼哈顿距离的衰减模式在空间上呈现出一种“菱形”或“方块状”的分布，这与人类视觉系统的径向衰减（Radial Pattern）并不一致。想象一下，当你盯着屏幕中心时，你的注意力是向四周圆周式扩散的，而不是沿着直角坐标轴。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">此外，RMT 采用的行列分解注意力机制虽然降低了复杂度，但其串行计算的特性限制了硬件的并行效率。为了打破这些瓶颈，EVT 带着两个核心改进登场了：</span></p><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">欧几里得距离衰减</span></b><span leaf="">：用更自然的径向距离取代直角距离。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">1D 标记分组</span></b><span leaf="">：用更灵活的序列分组取代复杂的行列分解。</span></p></li></ol><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="EVT 的整体架构图，展示了从 Conv Stem 到四个阶段的 EVT Block 堆叠过程" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175630" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.6185185185185185" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=18500c71&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibMErDiaHBsEAI8n4RhbiaXuJf3IIneAknAQTYTfFFQ6z0yywoE9J9ASmhh26uryVNNkicxN15DmUr1X7KLjrkpgmST2rrCoUjfVM%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">EVT 的整体架构图，展示了从 Conv Stem 到四个阶段的 EVT Block 堆叠过程</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">方法详解：欧几里得先验与 1D 分组的妙用</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">EVT 的整体架构延续了主流的分层设计，分为四个阶段（Stage），逐步降低特征图分辨率并增加通道数。其输入为 </span><span style="cursor:pointer;" data-formula="3 \times H \times W"><span data-formula="3 \times H \times W"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 4880.9 705" aria-hidden="true" style="vertical-align: -0.05ex;width: 11.043ex;height: 1.595ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mn"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path></g><g data-mml-node="mo" transform="translate(722.2, 0)"><path data-c="D7" d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path></g><g data-mml-node="mi" transform="translate(1722.4, 0)"><path data-c="48" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 219 683Q260 681 355 681Q389 681 418 681T463 682T483 682Q499 682 499 672Q499 670 497 658Q492 641 487 638H485Q483 638 480 638T473 638T464 637T455 637Q416 636 405 634T387 623Q384 619 355 500Q348 474 340 442T328 395L324 380Q324 378 469 378H614L615 381Q615 384 646 504Q674 619 674 627T617 637Q594 637 587 639T580 648Q580 650 582 660Q586 677 588 679T604 682Q609 682 646 681T740 680Q802 680 835 681T871 682Q888 682 888 672Q888 645 876 638H874Q872 638 869 638T862 638T853 637T844 637Q805 636 794 634T776 623Q773 618 704 340T634 58Q634 51 638 51Q646 48 692 46H723Q729 38 729 37T726 19Q722 6 716 0H701Q664 2 567 2Q533 2 504 2T458 2T437 1Q420 1 420 10Q420 15 423 24Q428 43 433 45Q437 46 448 46H454Q481 46 514 49Q520 50 522 50T528 55T534 64T540 82T547 110T558 153Q565 181 569 198Q602 330 602 331T457 332H312L279 197Q245 63 245 58Q245 51 253 49T303 46H334Q340 38 340 37T337 19Q333 6 327 0H312Q275 2 178 2Q144 2 115 2T69 2T48 1Q31 1 31 10Q31 12 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mo" transform="translate(2832.7, 0)"><path data-c="D7" d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path></g><g data-mml-node="mi" transform="translate(3832.9, 0)"><path data-c="57" d="M436 683Q450 683 486 682T553 680Q604 680 638 681T677 682Q695 682 695 674Q695 670 692 659Q687 641 683 639T661 637Q636 636 621 632T600 624T597 615Q597 603 613 377T629 138L631 141Q633 144 637 151T649 170T666 200T690 241T720 295T759 362Q863 546 877 572T892 604Q892 619 873 628T831 637Q817 637 817 647Q817 650 819 660Q823 676 825 679T839 682Q842 682 856 682T895 682T949 681Q1015 681 1034 683Q1048 683 1048 672Q1048 666 1045 655T1038 640T1028 637Q1006 637 988 631T958 617T939 600T927 584L923 578L754 282Q586 -14 585 -15Q579 -22 561 -22Q546 -22 542 -17Q539 -14 523 229T506 480L494 462Q472 425 366 239Q222 -13 220 -15T215 -19Q210 -22 197 -22Q178 -22 176 -15Q176 -12 154 304T131 622Q129 631 121 633T82 637H58Q51 644 51 648Q52 671 64 683H76Q118 680 176 680Q301 680 313 683H323Q329 677 329 674T327 656Q322 641 318 637H297Q236 634 232 620Q262 160 266 136L501 550L499 587Q496 629 489 632Q483 636 447 637Q428 637 422 639T416 648Q416 650 418 660Q419 664 420 669T421 676T424 680T428 682T436 683Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 的图像，经过 Conv Stem 下采样后进入核心 Block。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 欧几里得自注意力（EuSA）</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这是 EVT 的灵魂所在。在计算自注意力分数时，模型引入了一个基于欧几里得距离的衰减矩阵 </span><span style="cursor:pointer;" data-formula="E"><span data-formula="E"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -680 764 680" aria-hidden="true" style="vertical-align: 0px;width: 1.729ex;height: 1.538ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="45" d="M492 213Q472 213 472 226Q472 230 477 250T482 285Q482 316 461 323T364 330H312Q311 328 277 192T243 52Q243 48 254 48T334 46Q428 46 458 48T518 61Q567 77 599 117T670 248Q680 270 683 272Q690 274 698 274Q718 274 718 261Q613 7 608 2Q605 0 322 0H133Q31 0 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H757Q764 676 764 669Q764 664 751 557T737 447Q735 440 717 440H705Q698 445 698 453L701 476Q704 500 704 528Q704 558 697 578T678 609T643 625T596 632T532 634H485Q397 633 392 631Q388 629 386 622Q385 619 355 499T324 377Q347 376 372 376H398Q464 376 489 391T534 472Q538 488 540 490T557 493Q562 493 565 493T570 492T572 491T574 487T577 483L544 351Q511 218 508 216Q505 213 492 213Z"></path></g></g></g><g></g></svg></span></span><span leaf="">。其数学表达：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="E_{nm}^{2d}=\gamma^{\sqrt{(x_n-x_m)^2+(y_n-y_m)^2}}
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1425.7 10978.6 1680.5" aria-hidden="true" style="max-width: 300%;vertical-align: -0.576ex;width: 24.838ex;height: 3.802ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="mi"><path data-c="45" d="M492 213Q472 213 472 226Q472 230 477 250T482 285Q482 316 461 323T364 330H312Q311 328 277 192T243 52Q243 48 254 48T334 46Q428 46 458 48T518 61Q567 77 599 117T670 248Q680 270 683 272Q690 274 698 274Q718 274 718 261Q613 7 608 2Q605 0 322 0H133Q31 0 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H757Q764 676 764 669Q764 664 751 557T737 447Q735 440 717 440H705Q698 445 698 453L701 476Q704 500 704 528Q704 558 697 578T678 609T643 625T596 632T532 634H485Q397 633 392 631Q388 629 386 622Q385 619 355 499T324 377Q347 376 372 376H398Q464 376 489 391T534 472Q538 488 540 490T557 493Q562 493 565 493T570 492T572 491T574 487T577 483L544 351Q511 218 508 216Q505 213 492 213Z"></path></g><g data-mml-node="TeXAtom" transform="translate(819.2, 413) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mn"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="mi" transform="translate(500, 0)"><path data-c="64" d="M366 683Q367 683 438 688T511 694Q523 694 523 686Q523 679 450 384T375 83T374 68Q374 26 402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487H491Q506 153 506 145Q506 140 503 129Q490 79 473 48T445 8T417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157Q33 205 53 255T101 341Q148 398 195 420T280 442Q336 442 364 400Q369 394 369 396Q370 400 396 505T424 616Q424 629 417 632T378 637H357Q351 643 351 645T353 664Q358 683 366 683ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(738, -247) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(600, 0)"><path data-c="6D" d="M21 287Q22 293 24 303T36 341T56 388T88 425T132 442T175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q303 442 384 442Q401 442 415 440T441 433T460 423T475 411T485 398T493 385T497 373T500 364T502 357L510 367Q573 442 659 442Q713 442 746 415T780 336Q780 285 742 178T704 50Q705 36 709 31T724 26Q752 26 776 56T815 138Q818 149 821 151T837 153Q857 153 857 145Q857 144 853 130Q845 101 831 73T785 17T716 -10Q669 -10 648 17T627 73Q627 92 663 193T700 345Q700 404 656 404H651Q565 404 506 303L499 291L466 157Q433 26 428 16Q415 -11 385 -11Q372 -11 364 -4T353 8T350 18Q350 29 384 161L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 181Q151 335 151 342Q154 357 154 369Q154 405 129 405Q107 405 92 377T69 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g></g><g data-mml-node="mo" transform="translate(2110.9, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msup" transform="translate(3166.7, 0)"><g data-mml-node="mi"><path data-c="3B3" d="M31 249Q11 249 11 258Q11 275 26 304T66 365T129 418T206 441Q233 441 239 440Q287 429 318 386T371 255Q385 195 385 170Q385 166 386 166L398 193Q418 244 443 300T486 391T508 430Q510 431 524 431H537Q543 425 543 422Q543 418 522 378T463 251T391 71Q385 55 378 6T357 -100Q341 -165 330 -190T303 -216Q286 -216 286 -188Q286 -138 340 32L346 51L347 69Q348 79 348 100Q348 257 291 317Q251 355 196 355Q148 355 108 329T51 260Q49 251 47 251Q45 249 31 249Z"></path></g><g data-mml-node="TeXAtom" transform="translate(598, 492.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msqrt"><g transform="translate(1020, 0)"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(389, 0)"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mi" transform="translate(572, -150) scale(0.707)"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(1435.3, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="msub" transform="translate(2213.3, 0)"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mi" transform="translate(572, -150) scale(0.707)"><path data-c="6D" d="M21 287Q22 293 24 303T36 341T56 388T88 425T132 442T175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q303 442 384 442Q401 442 415 440T441 433T460 423T475 411T485 398T493 385T497 373T500 364T502 357L510 367Q573 442 659 442Q713 442 746 415T780 336Q780 285 742 178T704 50Q705 36 709 31T724 26Q752 26 776 56T815 138Q818 149 821 151T837 153Q857 153 857 145Q857 144 853 130Q845 101 831 73T785 17T716 -10Q669 -10 648 17T627 73Q627 92 663 193T700 345Q700 404 656 404H651Q565 404 506 303L499 291L466 157Q433 26 428 16Q415 -11 385 -11Q372 -11 364 -4T353 8T350 18Q350 29 384 161L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 181Q151 335 151 342Q154 357 154 369Q154 405 129 405Q107 405 92 377T69 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="msup" transform="translate(3456.1, 0)"><g data-mml-node="mo"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mn" transform="translate(389, 363) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="mo" transform="translate(4248.7, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mo" transform="translate(5026.7, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(5415.7, 0)"><g data-mml-node="mi"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(490, -150) scale(0.707)"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(6379.9, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="msub" transform="translate(7157.9, 0)"><g data-mml-node="mi"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(490, -150) scale(0.707)"><path data-c="6D" d="M21 287Q22 293 24 303T36 341T56 388T88 425T132 442T175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q303 442 384 442Q401 442 415 440T441 433T460 423T475 411T485 398T493 385T497 373T500 364T502 357L510 367Q573 442 659 442Q713 442 746 415T780 336Q780 285 742 178T704 50Q705 36 709 31T724 26Q752 26 776 56T815 138Q818 149 821 151T837 153Q857 153 857 145Q857 144 853 130Q845 101 831 73T785 17T716 -10Q669 -10 648 17T627 73Q627 92 663 193T700 345Q700 404 656 404H651Q565 404 506 303L499 291L466 157Q433 26 428 16Q415 -11 385 -11Q372 -11 364 -4T353 8T350 18Q350 29 384 161L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 181Q151 335 151 342Q154 357 154 369Q154 405 129 405Q107 405 92 377T69 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="msup" transform="translate(8318.8, 0)"><g data-mml-node="mo"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mn" transform="translate(389, 363) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g></g><g data-mml-node="mo" transform="translate(0, 127)"><path data-c="221A" d="M1001 1150Q1017 1150 1020 1132Q1020 1127 741 244L460 -643Q453 -650 436 -650H424Q423 -647 423 -645T421 -640T419 -631T415 -617T408 -594T399 -560T385 -512T367 -448T343 -364T312 -259L203 119L138 41L111 67L212 188L264 248L472 -474L983 1140Q988 1150 1001 1150Z"></path></g><rect width="9111.3" height="42.4" x="1020" y="1234.6"></rect></g></g></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中，</span><span style="cursor:pointer;" data-formula="(x_n, y_n)"><span data-formula="(x_n, y_n)"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 3233.2 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 7.315ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(389, 0)"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mi" transform="translate(572, -150) scale(0.707)"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(1435.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(1879.9, 0)"><g data-mml-node="mi"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(490, -150) scale(0.707)"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(2844.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 是标记的物理坐标，</span><span style="cursor:pointer;" data-formula="\gamma"><span data-formula="\gamma"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -441 543 657" aria-hidden="true" style="vertical-align: -0.489ex;width: 1.229ex;height: 1.486ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3B3" d="M31 249Q11 249 11 258Q11 275 26 304T66 365T129 418T206 441Q233 441 239 440Q287 429 318 386T371 255Q385 195 385 170Q385 166 386 166L398 193Q418 244 443 300T486 391T508 430Q510 431 524 431H537Q543 425 543 422Q543 418 522 378T463 251T391 71Q385 55 378 6T357 -100Q341 -165 330 -190T303 -216Q286 -216 286 -188Q286 -138 340 32L346 51L347 69Q348 79 348 100Q348 257 291 317Q251 355 196 355Q148 355 108 329T51 260Q49 251 47 251Q45 249 31 249Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 是一个控制衰减强度的超参数。通过将这个矩阵与原始注意力分数逐元素相乘（</span><span style="cursor:pointer;" data-formula="\odot"><span data-formula="\odot"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -583 778 666" aria-hidden="true" style="vertical-align: -0.188ex;width: 1.76ex;height: 1.507ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="2299" d="M56 250Q56 394 156 488T384 583Q530 583 626 485T722 250Q722 110 625 14T390 -83Q249 -83 153 14T56 250ZM682 250Q682 322 649 387T546 497T381 542Q272 542 184 459T95 250Q95 132 178 45T389 -42Q515 -42 598 45T682 250ZM311 250Q311 285 332 304T375 328Q376 328 382 328T392 329Q424 326 445 305T466 250Q466 217 445 195T389 172Q354 172 333 195T311 250Z"></path></g></g></g><g></g></svg></span></span><span leaf="">），模型被显式地赋予了“近大远小”的空间直觉。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作者通过 JS 散度（Jensen-Shannon divergence）分析发现，这种欧几里得衰减矩阵生成的分布，与那些经过海量数据训练后的 ViT 模型（如 DINOv2）自发学习到的注意力分布高度相似。这意味着，我们不需要数亿张图片的预训练，就能让模型直接获得这种高质量的空间感知力。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="不同距离矩阵与无衰减模型注意力分数的 JS 散度对比，欧几里得距离表现最接近自然分布" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175627" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.4561611374407583" data-w="844" src="https://wechat2rss.xlab.app/img-proxy/?k=01a266b2&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8y3O26SrGG0JO7O19e9fVCSGW1M1q53pMGLBSycqMCFX77nLqywhcsZumicxWiagrOeIZcGHeXyC9MQtjqj6yL6llDHwibntMY2c%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">不同距离矩阵与无衰减模型注意力分数的 JS 散度对比，欧几里得距离表现最接近自然分布</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">有趣的是，研究团队还测试了更复杂的距离函数，如 Minkowski 距离（</span><span style="cursor:pointer;" data-formula="p=3, 4, 5"><span data-formula="p=3, 4, 5"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -677 4225.9 871" aria-hidden="true" style="vertical-align: -0.439ex;width: 9.561ex;height: 1.971ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="70" d="M23 287Q24 290 25 295T30 317T40 348T55 381T75 411T101 433T134 442Q209 442 230 378L240 387Q302 442 358 442Q423 442 460 395T497 281Q497 173 421 82T249 -10Q227 -10 210 -4Q199 1 187 11T168 28L161 36Q160 35 139 -51T118 -138Q118 -144 126 -145T163 -148H188Q194 -155 194 -157T191 -175Q188 -187 185 -190T172 -194Q170 -194 161 -194T127 -193T65 -192Q-5 -192 -24 -194H-32Q-39 -187 -39 -183Q-37 -156 -26 -148H-6Q28 -147 33 -136Q36 -130 94 103T155 350Q156 355 156 364Q156 405 131 405Q109 405 94 377T71 316T59 280Q57 278 43 278H29Q23 284 23 287ZM178 102Q200 26 252 26Q282 26 310 49T356 107Q374 141 392 215T411 325V331Q411 405 350 405Q339 405 328 402T306 393T286 380T269 365T254 350T243 336T235 326L232 322Q232 321 229 308T218 264T204 212Q178 106 178 102Z"></path></g><g data-mml-node="mo" transform="translate(780.8, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(1836.6, 0)"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path></g><g data-mml-node="mo" transform="translate(2336.6, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mn" transform="translate(2781.2, 0)"><path data-c="34" d="M462 0Q444 3 333 3Q217 3 199 0H190V46H221Q241 46 248 46T265 48T279 53T286 61Q287 63 287 115V165H28V211L179 442Q332 674 334 675Q336 677 355 677H373L379 671V211H471V165H379V114Q379 73 379 66T385 54Q393 47 442 46H471V0H462ZM293 211V545L74 212L183 211H293Z"></path></g><g data-mml-node="mo" transform="translate(3281.2, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mn" transform="translate(3725.9, 0)"><path data-c="35" d="M164 157Q164 133 148 117T109 101H102Q148 22 224 22Q294 22 326 82Q345 115 345 210Q345 313 318 349Q292 382 260 382H254Q176 382 136 314Q132 307 129 306T114 304Q97 304 95 310Q93 314 93 485V614Q93 664 98 664Q100 666 102 666Q103 666 123 658T178 642T253 634Q324 634 389 662Q397 666 402 666Q410 666 410 648V635Q328 538 205 538Q174 538 149 544L139 546V374Q158 388 169 396T205 412T256 420Q337 420 393 355T449 201Q449 109 385 44T229 -22Q148 -22 99 32T50 154Q50 178 61 192T84 210T107 214Q132 214 148 197T164 157Z"></path></g></g></g><g></g></svg></span></span><span leaf="">）或高斯 RBF 核。结果发现，这些高阶函数虽然理论上更平滑，但会导致训练极度不稳定，甚至出现 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">NaN</span></strong><span leaf="">。相比之下，欧几里得距离在性能与稳定性之间取得了完美的平衡。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 1D 标记分组策略</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了处理高分辨率图像，EVT 放弃了 RMT 中那种复杂的水平/垂直分解，转而采用了一种看似简单却极其有效的 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">1D 分组方法</span></strong><span leaf="">。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">具体来说，模型将 2D 特征图展开成 1D 序列，然后直接进行分组（Grouped EuSA）或扩张分组（Dilated EuSA）。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">Grouped EuSA (</span><span style="cursor:pointer;" data-formula="{\rm EuSA_g}"><span data-formula="{\rm EuSA_g}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -716 2946.6 1011.7" aria-hidden="true" style="vertical-align: -0.669ex;width: 6.666ex;height: 2.289ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="45" d="M128 619Q121 626 117 628T101 631T58 634H25V680H597V676Q599 670 611 560T625 444V440H585V444Q584 447 582 465Q578 500 570 526T553 571T528 601T498 619T457 629T411 633T353 634Q266 634 251 633T233 622Q233 622 233 621Q232 619 232 497V376H286Q359 378 377 385Q413 401 416 469Q416 471 416 473V493H456V213H416V233Q415 268 408 288T383 317T349 328T297 330Q290 330 286 330H232V196V114Q232 57 237 52Q243 47 289 47H340H391Q428 47 452 50T505 62T552 92T584 146Q594 172 599 200T607 247T612 270V273H652V270Q651 267 632 137T610 3V0H25V46H58Q100 47 109 49T128 61V619Z"></path></g><g data-mml-node="mi" transform="translate(681, 0)"><path data-c="75" d="M383 58Q327 -10 256 -10H249Q124 -10 105 89Q104 96 103 226Q102 335 102 348T96 369Q86 385 36 385H25V408Q25 431 27 431L38 432Q48 433 67 434T105 436Q122 437 142 438T172 441T184 442H187V261Q188 77 190 64Q193 49 204 40Q224 26 264 26Q290 26 311 35T343 58T363 90T375 120T379 144Q379 145 379 161T380 201T380 248V315Q380 361 370 372T320 385H302V431Q304 431 378 436T457 442H464V264Q464 84 465 81Q468 61 479 55T524 46H542V0Q540 0 467 -5T390 -11H383V58Z"></path></g><g data-mml-node="mi" transform="translate(1237, 0)"><path data-c="53" d="M55 507Q55 590 112 647T243 704H257Q342 704 405 641L426 672Q431 679 436 687T446 700L449 704Q450 704 453 704T459 705H463Q466 705 472 699V462L466 456H448Q437 456 435 459T430 479Q413 605 329 646Q292 662 254 662Q201 662 168 626T135 542Q135 508 152 480T200 435Q210 431 286 412T370 389Q427 367 463 314T500 191Q500 110 448 45T301 -21Q245 -21 201 -4T140 27L122 41Q118 36 107 21T87 -7T78 -21Q76 -22 68 -22H64Q61 -22 55 -16V101Q55 220 56 222Q58 227 76 227H89Q95 221 95 214Q95 182 105 151T139 90T205 42T305 24Q352 24 386 62T420 155Q420 198 398 233T340 281Q284 295 266 300Q261 301 239 306T206 314T174 325T141 343T112 367T85 402Q55 451 55 507Z"></path></g><g data-mml-node="msub" transform="translate(1793, 0)"><g data-mml-node="mi"><path data-c="41" d="M255 0Q240 3 140 3Q48 3 39 0H32V46H47Q119 49 139 88Q140 91 192 245T295 553T348 708Q351 716 366 716H376Q396 715 400 709Q402 707 508 390L617 67Q624 54 636 51T687 46H717V0H708Q699 3 581 3Q458 3 437 0H427V46H440Q510 46 510 64Q510 66 486 138L462 209H229L209 150Q189 91 189 85Q189 72 209 59T259 46H264V0H255ZM447 255L345 557L244 256Q244 255 345 255H447Z"></path></g><g data-mml-node="mi" transform="translate(750, -150) scale(0.707)"><path data-c="67" d="M329 409Q373 453 429 453Q459 453 472 434T485 396Q485 382 476 371T449 360Q416 360 412 390Q410 404 415 411Q415 412 416 414V415Q388 412 363 393Q355 388 355 386Q355 385 359 381T368 369T379 351T388 325T392 292Q392 230 343 187T222 143Q172 143 123 171Q112 153 112 133Q112 98 138 81Q147 75 155 75T227 73Q311 72 335 67Q396 58 431 26Q470 -13 470 -72Q470 -139 392 -175Q332 -206 250 -206Q167 -206 107 -175Q29 -140 29 -75Q29 -39 50 -15T92 18L103 24Q67 55 67 108Q67 155 96 193Q52 237 52 292Q52 355 102 398T223 442Q274 442 318 416L329 409ZM299 343Q294 371 273 387T221 404Q192 404 171 388T145 343Q142 326 142 292Q142 248 149 227T179 192Q196 182 222 182Q244 182 260 189T283 207T294 227T299 242Q302 258 302 292T299 343ZM403 -75Q403 -50 389 -34T348 -11T299 -2T245 0H218Q151 0 138 -6Q118 -15 107 -34T95 -74Q95 -84 101 -97T122 -127T170 -155T250 -167Q319 -167 361 -139T403 -75Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">)</span></b><span leaf="">：负责捕捉局部信息。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">Dilated EuSA (</span><span style="cursor:pointer;" data-formula="{\rm EuSA_d}"><span data-formula="{\rm EuSA_d}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -716 2986.2 873.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 6.756ex;height: 1.977ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="45" d="M128 619Q121 626 117 628T101 631T58 634H25V680H597V676Q599 670 611 560T625 444V440H585V444Q584 447 582 465Q578 500 570 526T553 571T528 601T498 619T457 629T411 633T353 634Q266 634 251 633T233 622Q233 622 233 621Q232 619 232 497V376H286Q359 378 377 385Q413 401 416 469Q416 471 416 473V493H456V213H416V233Q415 268 408 288T383 317T349 328T297 330Q290 330 286 330H232V196V114Q232 57 237 52Q243 47 289 47H340H391Q428 47 452 50T505 62T552 92T584 146Q594 172 599 200T607 247T612 270V273H652V270Q651 267 632 137T610 3V0H25V46H58Q100 47 109 49T128 61V619Z"></path></g><g data-mml-node="mi" transform="translate(681, 0)"><path data-c="75" d="M383 58Q327 -10 256 -10H249Q124 -10 105 89Q104 96 103 226Q102 335 102 348T96 369Q86 385 36 385H25V408Q25 431 27 431L38 432Q48 433 67 434T105 436Q122 437 142 438T172 441T184 442H187V261Q188 77 190 64Q193 49 204 40Q224 26 264 26Q290 26 311 35T343 58T363 90T375 120T379 144Q379 145 379 161T380 201T380 248V315Q380 361 370 372T320 385H302V431Q304 431 378 436T457 442H464V264Q464 84 465 81Q468 61 479 55T524 46H542V0Q540 0 467 -5T390 -11H383V58Z"></path></g><g data-mml-node="mi" transform="translate(1237, 0)"><path data-c="53" d="M55 507Q55 590 112 647T243 704H257Q342 704 405 641L426 672Q431 679 436 687T446 700L449 704Q450 704 453 704T459 705H463Q466 705 472 699V462L466 456H448Q437 456 435 459T430 479Q413 605 329 646Q292 662 254 662Q201 662 168 626T135 542Q135 508 152 480T200 435Q210 431 286 412T370 389Q427 367 463 314T500 191Q500 110 448 45T301 -21Q245 -21 201 -4T140 27L122 41Q118 36 107 21T87 -7T78 -21Q76 -22 68 -22H64Q61 -22 55 -16V101Q55 220 56 222Q58 227 76 227H89Q95 221 95 214Q95 182 105 151T139 90T205 42T305 24Q352 24 386 62T420 155Q420 198 398 233T340 281Q284 295 266 300Q261 301 239 306T206 314T174 325T141 343T112 367T85 402Q55 451 55 507Z"></path></g><g data-mml-node="msub" transform="translate(1793, 0)"><g data-mml-node="mi"><path data-c="41" d="M255 0Q240 3 140 3Q48 3 39 0H32V46H47Q119 49 139 88Q140 91 192 245T295 553T348 708Q351 716 366 716H376Q396 715 400 709Q402 707 508 390L617 67Q624 54 636 51T687 46H717V0H708Q699 3 581 3Q458 3 437 0H427V46H440Q510 46 510 64Q510 66 486 138L462 209H229L209 150Q189 91 189 85Q189 72 209 59T259 46H264V0H255ZM447 255L345 557L244 256Q244 255 345 255H447Z"></path></g><g data-mml-node="mi" transform="translate(750, -150) scale(0.707)"><path data-c="64" d="M376 495Q376 511 376 535T377 568Q377 613 367 624T316 637H298V660Q298 683 300 683L310 684Q320 685 339 686T376 688Q393 689 413 690T443 693T454 694H457V390Q457 84 458 81Q461 61 472 55T517 46H535V0Q533 0 459 -5T380 -11H373V44L365 37Q307 -11 235 -11Q158 -11 96 50T34 215Q34 315 97 378T244 442Q319 442 376 393V495ZM373 342Q328 405 260 405Q211 405 173 369Q146 341 139 305T131 211Q131 155 138 120T173 59Q203 26 251 26Q322 26 373 103V342Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">)</span></b><span leaf="">：通过跨步采样，负责捕捉全局依赖。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="分组 EuSA 和扩张 EuSA 的示意图，展示了 1D 序列下的标记交互方式" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175629" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.3611111111111111" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=9a0415e8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW95aUJcVnCSI3dnuBGKlybzCTx7rdibBWricB2fesx8z9Jlp6DGtq96ZkXz7TOpuAPbqLuqsx27W35ZA2m8oa4M9sYfkH059BkxU%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">分组 EuSA 和扩张 EuSA 的示意图，展示了 1D 序列下的标记交互方式</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">你可能会担心：1D 分组不是破坏了 2D 空间结构吗？ 这正是 EVT 的巧妙之处。因为我们在 EuSA 中已经引入了基于 2D 物理坐标的欧几里得衰减，所以即便标记在序列中是“1D 邻居”，模型依然知道它们在物理空间上的真实距离。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">更重要的是，作者从理论上证明了 1D 分组的 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">覆盖率（Coverage Ratio）</span></strong><span leaf=""> 优势。在相同的计算预算下，1D 分组每层覆盖的标记数量是 2D 分组的 </span><span style="cursor:pointer;" data-formula="g"><span data-formula="g"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 477 647" aria-hidden="true" style="vertical-align: -0.464ex;width: 1.079ex;height: 1.464ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 倍（</span><span style="cursor:pointer;" data-formula="g"><span data-formula="g"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 477 647" aria-hidden="true" style="vertical-align: -0.464ex;width: 1.079ex;height: 1.464ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 为组数）。这意味着 EVT 能以更快的速度获得全局感受野。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="1D 分组与 2D 分组的对比，1D 方式在保持空间先验的同时提供了更长的交互范围" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175633" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.8094117647058824" data-w="850" src="https://wechat2rss.xlab.app/img-proxy/?k=64d34fb9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicRV60sYSiap0uCWiaFjGY8gcAib78xyyNcDk4XmiaHmnjSW2HqnTGEDzyTmmRA1giarSZlCh2O3zlyJ7Fxq7IaM1SMYsbMnLpk5qS4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">1D 分组与 2D 分组的对比，1D 方式在保持空间先验的同时提供了更长的交互范围</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果：全线飘红的性能指标</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队在 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">NVIDIA A100 GPU</span></strong><span leaf=""> 上对 EVT 进行了全面的评测，涵盖了分类、检测、分割以及鲁棒性测试。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">ImageNet-1K 分类任务</span></span></h3><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175637" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7935185185185185" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=0fd033ea&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9MkbnYXA4Y8WnSIwSplYbWebRqicYotnln1ibmWNg7JFDOib2WR5Q7QcER9ichic0uh8VTaKWnhJA9sibrYbhyYCzCqQE47tsfSyjpQ%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在 224x224 分辨率下，</span><font color="#0000FF"><b><span leaf="">EVT-L</span></b></font><span leaf=""> 达到了 </span><font color="#0000FF"><b><span leaf="">85.8%</span></b></font><span leaf=""> 的 Top-1 准确率。当分辨率提升至 384x384 时，准确率进一步飙升至 </span><font color="#0000FF"><b><span leaf="">86.6%</span></b></font><span leaf="">。更令人印象深刻的是，EVT-T（微型版本）仅凭 15M 的参数量就拿下了 </span><font color="#0000FF"><b><span leaf="">83.0%</span></b></font><span leaf=""> 的成绩，显著优于同量级的 Swin-T 和 ConvNeXt-T。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="EVT 各个变体在 ImageNet-1K 上的性能表现，展示了其在不同 FLOPs 下的竞争力" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175636" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.4324074074074074" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=43c2c563&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9aS7qwujcGn9y4VcuD7HbBPnE37zqD9ayx5B9sXZQV7aIdwCUnECv8HbLNZl3LicLvLPpjFMJkltPBlXbs8DicBjiajz1fHI8oYE%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">EVT 各个变体在 ImageNet-1K 上的性能表现，展示了其在不同 FLOPs 下的竞争力</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">目标检测与分割</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在 COCO 数据集上，EVT 同样展现了强大的下游迁移能力。使用 Mask R-CNN 框架时，</span><font color="#0000FF"><b><span leaf="">EVT-B</span></b></font><span leaf=""> 的 </span><span style="cursor:pointer;" data-formula="AP^b"><span data-formula="AP^b"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -853.7 1926.1 853.7" aria-hidden="true" style="vertical-align: 0px;width: 4.358ex;height: 1.932ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="41" d="M208 74Q208 50 254 46Q272 46 272 35Q272 34 270 22Q267 8 264 4T251 0Q249 0 239 0T205 1T141 2Q70 2 50 0H42Q35 7 35 11Q37 38 48 46H62Q132 49 164 96Q170 102 345 401T523 704Q530 716 547 716H555H572Q578 707 578 706L606 383Q634 60 636 57Q641 46 701 46Q726 46 726 36Q726 34 723 22Q720 7 718 4T704 0Q701 0 690 0T651 1T578 2Q484 2 455 0H443Q437 6 437 9T439 27Q443 40 445 43L449 46H469Q523 49 533 63L521 213H283L249 155Q208 86 208 74ZM516 260Q516 271 504 416T490 562L463 519Q447 492 400 412L310 260L413 259Q516 259 516 260Z"></path></g><g data-mml-node="msup" transform="translate(750, 0)"><g data-mml-node="mi"><path data-c="50" d="M287 628Q287 635 230 637Q206 637 199 638T192 648Q192 649 194 659Q200 679 203 681T397 683Q587 682 600 680Q664 669 707 631T751 530Q751 453 685 389Q616 321 507 303Q500 302 402 301H307L277 182Q247 66 247 59Q247 55 248 54T255 50T272 48T305 46H336Q342 37 342 35Q342 19 335 5Q330 0 319 0Q316 0 282 1T182 2Q120 2 87 2T51 1Q33 1 33 11Q33 13 36 25Q40 41 44 43T67 46Q94 46 127 49Q141 52 146 61Q149 65 218 339T287 628ZM645 554Q645 567 643 575T634 597T609 619T560 635Q553 636 480 637Q463 637 445 637T416 636T404 636Q391 635 386 627Q384 621 367 550T332 412T314 344Q314 342 395 342H407H430Q542 342 590 392Q617 419 631 471T645 554Z"></path></g><g data-mml-node="mi" transform="translate(822.8, 363) scale(0.707)"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 达到了 </span><font color="#0000FF"><b><span leaf="">53.3</span></b></font><span leaf="">，比 RMT-B 提升了 1.1 点。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="COCO 数据集上的检测结果对比，EVT 在各个指标上均领先于 RMT 和 Swin" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175635" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.4462962962962963" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=bdda02a7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8rz5EONfrlF2VicCf6xxPhicoJWSmaJq4RQxiawFOdvQNtialInF9ricibhvgEbKxKBt67DdWEbISdZVAWZHKzensavibmwTEVyRwjr0%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">COCO 数据集上的检测结果对比，EVT 在各个指标上均领先于 RMT 和 Swin</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在 ADE20K 语义分割任务中，EVT-L 配合 UperNet 框架刷出了 </span><font color="#0000FF"><b><span leaf="">53.6%</span></b></font><span leaf=""> 的 mIoU，这一表现甚至超越了许多参数量大一个数量级的模型。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175634" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5861111111111111" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=de04c5c0&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9KerUSRIpz93ZeoIrBjR0jTYmicNGxibxh4w0E7Cq6byhMvSdL4dWHsSszlpycBwSUibE5fU7qqf0ezQO3xlibK6eic6OP8zl9ckcM%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">推理效率与稳定性</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">得益于 1D 分组策略对硬件的友好性，EVT 的推理速度非常快。在 A100 上，EVT-T 的吞吐量达到了 </span><font color="#0000FF"><b><span leaf="">2142 imgs/s</span></b></font><span leaf="">，相比 RMT-T 的 1650 imgs/s 提升了近 30%。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">此外，Fig 5 的 Loss 曲线清晰地展示了欧几里得距离在训练初期的稳定性优势。相比曼哈顿距离，欧几里得距离的收敛过程更加平滑，最终达到的精度也更高。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="Loss 曲线对比，展示了欧几里得距离在训练稳定性上的卓越表现" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175639" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7397420867526378" data-w="853" src="https://wechat2rss.xlab.app/img-proxy/?k=48dd77bb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8NNLqUnkunx2mEXF5kbsUn2PqRuuBNibgEoFBwBcFMTrl28CnLW4zoFw6vMrAicP9ic2qNgQeSicmm8dstdcf2nZ7E4hATGltBhZs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">Loss 曲线对比，展示了欧几里得距离在训练稳定性上的卓越表现</span></figcaption></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="不同模型的推理吞吐量对比，EVT 实现了更好的精度-速度平衡" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175641" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="1.7181603773584906" data-w="848" src="https://wechat2rss.xlab.app/img-proxy/?k=8d958658&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibtWqYUtichXj1hKq06jS8cGSkABluT2ibjXQSnwH6fnIuUhfVKyOAFhTDibDbOicwy9Bzzea8c0fiasRCGRhvGPrWt0DMiaMb122UYE%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">不同模型的推理吞吐量对比，EVT 实现了更好的精度-速度平衡</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从 RMT 到 EVT 的进化，不仅仅是距离度量方式的改变（Manhattan </span><span style="cursor:pointer;" data-formula="\rightarrow"><span data-formula="\rightarrow"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -511 1000 522" aria-hidden="true" style="vertical-align: -0.025ex;width: 2.262ex;height: 1.181ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="2192" d="M56 237T56 250T70 270H835Q719 357 692 493Q692 494 692 496T691 499Q691 511 708 511H711Q720 511 723 510T729 506T732 497T735 481T743 456Q765 389 816 336T935 261Q944 258 944 250Q944 244 939 241T915 231T877 212Q836 186 806 152T761 85T740 35T732 4Q730 -6 727 -8T711 -11Q691 -11 691 0Q691 7 696 25Q728 151 835 230H70Q56 237 56 250Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> Euclidean），更是一次对视觉模型“底层逻辑”的重构。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="从 RMT 到 EVT 的演进路线图，每一步改进都带来了实打实的性能提升" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175638" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.39774330042313116" data-w="709" src="https://wechat2rss.xlab.app/img-proxy/?k=29e7ca27&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW86ibpY0r3H8Dia568eLVPAIuhnPDbuHUP7p5wa2b6G20upNZwvUu6ZyFXoLf3GRymdsYG4ZErbMG8JhZ691DUe7mlo9LoWlgfUQ%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">从 RMT 到 EVT 的演进路线图，每一步改进都带来了实打实的性能提升</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">通过下图可视化对比，我们可以直观地看到：引入欧几里得先验后，模型的注意力分布变得更加集中且平滑，有效减少了注意力分散（Attention Dispersion）现象。这说明，符合物理直觉的先验知识，能够显著降低 Transformer 的学习难度。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="注意力分布可视化，EVT 的注意力更加集中且符合物体轮廓" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175642" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="1.341549295774648" data-w="852" src="https://wechat2rss.xlab.app/img-proxy/?k=36afcd8e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicNB5t0onPj6kad9oR1uUSsj6QSMnuGS5Tc59w38BwOW0o3lticmbIy6SBC5blh3SaITv6wej1YXficrPnEBIRXrun8ecgTPEWZU%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">注意力分布可视化，EVT 的注意力更加集中且符合物体轮廓</span></figcaption></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175640" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.125" data-w="960" src="https://wechat2rss.xlab.app/img-proxy/?k=6ecac00b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGWibD8yMYnAN19GWrZUtRf3iarTVZVeic7AbDd9uWBUICJJUYSyd528ocutosbeEb0dKcIOYUszPpicJSschcaicZQicWictxkhoPiaEYZ0%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175643" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7064814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=33d2eaf0&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9Q5ibKSicrWiab5tMQmhGms4NAePwgBDzBWlBK6s8BrCjKZ5aWGJlojatpFyk4TibhichuiacWNVlC3T1reWrcFlOUVVfZ6khrkUu7Q%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=87d30394&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659310%26idx%3D1%26sn%3D4f86aaacd82e2bbb04ce95b3cc0d537e">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Sun, 03 May 2026 23:12:00 +0800</pubDate>
    </item>
    <item>
      <title>华科&amp;达摩院提出 AnimateAnyMesh++：4D基础模型新探索，13秒完成4D动画生成</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659274&amp;idx=1&amp;sn=6deafcaa909bcfebef3baa2c060b5969</link>
      <description>13秒驱动任意 3D 网格“动”起来</description>
      <content:encoded><![CDATA[<p><span>CV君</span> <span>2026-04-30 23:20</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=4ec7cd7a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGWibH9Sv5THmU49XVMicSmaWVs3GnVfrRTX73uXFHPjAKvdibibNSV4Zwia64Opw00EtoJ9yU0XRticlA6MIuC38NHVPA8qP9QMzAYOics%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>13秒驱动任意 3D 网格“动”起来</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175617" data-ratio="0.2778649921507064" data-type="gif" data-w="637" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=00f41710&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGWibErbzgWQTU2Ut2TnhgmOCcBNmpVCSFg6HNmEibqKX7icZWHRnCTCjxtTWqBx23xSibq3Ow60rLK6qibSpiacjVmD5hXgDBmztmHT1Y%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在 3D 内容创作如火如荼的今天，如何让静态的 3D 模型“活”起来，一直是图形学和 AI 交叉领域的一大难题。传统的动画制作依赖复杂的骨骼绑定（Rigging）和权重刷取，这对于普通用户来说门槛极高。近日，华中科技大学与阿里巴巴达摩院的研究团队联合发布了 </span><b><span leaf="">AnimateAnyMesh++</span></b><span leaf="">，这是一个专为通用网格动画设计的前向推理框架。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175614" data-ratio="0.24166666666666667" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=930344b7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9DbDLkCmib7ib7FIjLM5XFbtFmEsjgibUjjXdMEBeicsZcDxFXyAmFdgcJYIBlNFQMgSjl3ChwELwUk8ASD1gxILwEFmiaaChNakGo%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2604.26917" target="_blank">https://arxiv.org/abs/2604.26917</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">代码仓库</span></b><span leaf="">: <a href="https://github.com/JarrentWu1031/AnimateAnyMesh-pp" target="_blank">https://github.com/JarrentWu1031/AnimateAnyMesh-pp</a> (将开源)</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">主要机构</span></b><span leaf="">: 华中科技大学、阿里巴巴达摩院</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">4D 生成的“深水区”：数据与一致性的博弈</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">让 3D 模型动起来（即 4D 生成）之所以难，主要有两个痛点：一是 </span><b><span leaf="">4D 数据极度匮乏</span></b><span leaf="">，相比于海量的图像和视频数据，高质量的动态网格序列少得可怜；二是 </span><b><span leaf="">时空分布复杂</span></b><span leaf="">。现有的方法要么依赖耗时的单例优化（如 SDS 蒸馏），生成一个动画需要十几分钟甚至数小时；要么先生成视频再进行 4D 重建，这往往会导致严重的视图不一致或几何畸变。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了解决这些问题，研究团队另辟蹊径，提出了一种无需骨骼、基于顶点轨迹预测的管线。这种方案直接建模每个顶点的运动路径，天然地支持任意拓扑结构，甚至能处理非刚性变形（如布料抖动、肌肉收缩）。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">核心技术：DyMeshVAE-Flex 与 PLTA 注意力</span></span></h2><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">灵活的轨迹压缩：DyMeshVAE-Flex</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">AnimateAnyMesh++ 的核心组件之一是 </span><b><span leaf="">DyMeshVAE-Flex</span></b><span leaf="">， </span><b><span leaf="">Flex</span></b><span leaf="">，意在强调其对变长序列处理的灵活性。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="DyMeshVAE-Flex 架构图，展示了从长序列分块到重组的完整流程" class="rich_pages wxw-img" data-ratio="0.4666666666666667" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175616" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=8d42b987&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8zC9R9ibf9ia4hz8sVHvrgLWLASNgdPgsjTDq5aJWPreibHGD7eLTvD29MDntCr2wERMJFvwyZlAUwftfA5TJRvHicUDFEECDuiaHo%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">DyMeshVAE-Flex 架构图，展示了从长序列分块到重组的完整流程</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">如上图所示，该模型首先将动态网格序列 </span><span style="cursor:pointer;" data-formula="D"><span data-formula="D"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 828 683" aria-hidden="true" style="vertical-align: 0px;width: 1.873ex;height: 1.545ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="44" d="M287 628Q287 635 230 637Q207 637 200 638T193 647Q193 655 197 667T204 682Q206 683 403 683Q570 682 590 682T630 676Q702 659 752 597T803 431Q803 275 696 151T444 3L430 1L236 0H125H72Q48 0 41 2T33 11Q33 13 36 25Q40 41 44 43T67 46Q94 46 127 49Q141 52 146 61Q149 65 218 339T287 628ZM703 469Q703 507 692 537T666 584T629 613T590 629T555 636Q553 636 541 636T512 636T479 637H436Q392 637 386 627Q384 623 313 339T242 52Q242 48 253 48T330 47Q335 47 349 47T373 46Q499 46 581 128Q617 164 640 212T683 339T703 469Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 分解为初始顶点 </span><span style="cursor:pointer;" data-formula="V_0"><span data-formula="V_0"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 986.6 848.6" aria-hidden="true" style="vertical-align: -0.375ex;width: 2.232ex;height: 1.92ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="56" d="M52 648Q52 670 65 683H76Q118 680 181 680Q299 680 320 683H330Q336 677 336 674T334 656Q329 641 325 637H304Q282 635 274 635Q245 630 242 620Q242 618 271 369T301 118L374 235Q447 352 520 471T595 594Q599 601 599 609Q599 633 555 637Q537 637 537 648Q537 649 539 661Q542 675 545 679T558 683Q560 683 570 683T604 682T668 681Q737 681 755 683H762Q769 676 769 672Q769 655 760 640Q757 637 743 637Q730 636 719 635T698 630T682 623T670 615T660 608T652 599T645 592L452 282Q272 -9 266 -16Q263 -18 259 -21L241 -22H234Q216 -22 216 -15Q213 -9 177 305Q139 623 138 626Q133 637 76 637H59Q52 642 52 648Z"></path></g><g data-mml-node="mn" transform="translate(583, -150) scale(0.707)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 和相对轨迹 </span><span style="cursor:pointer;" data-formula="V_T"><span data-formula="V_T"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 1130.8 833" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.558ex;height: 1.885ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="56" d="M52 648Q52 670 65 683H76Q118 680 181 680Q299 680 320 683H330Q336 677 336 674T334 656Q329 641 325 637H304Q282 635 274 635Q245 630 242 620Q242 618 271 369T301 118L374 235Q447 352 520 471T595 594Q599 601 599 609Q599 633 555 637Q537 637 537 648Q537 649 539 661Q542 675 545 679T558 683Q560 683 570 683T604 682T668 681Q737 681 755 683H762Q769 676 769 672Q769 655 760 640Q757 637 743 637Q730 636 719 635T698 630T682 623T670 615T660 608T652 599T645 592L452 282Q272 -9 266 -16Q263 -18 259 -21L241 -22H234Q216 -22 216 -15Q213 -9 177 305Q139 623 138 626Q133 637 76 637H59Q52 642 52 648Z"></path></g><g data-mml-node="mi" transform="translate(583, -150) scale(0.707)"><path data-c="54" d="M40 437Q21 437 21 445Q21 450 37 501T71 602L88 651Q93 669 101 677H569H659Q691 677 697 676T704 667Q704 661 687 553T668 444Q668 437 649 437Q640 437 637 437T631 442L629 445Q629 451 635 490T641 551Q641 586 628 604T573 629Q568 630 515 631Q469 631 457 630T439 622Q438 621 368 343T298 60Q298 48 386 46Q418 46 427 45T436 36Q436 31 433 22Q429 4 424 1L422 0Q419 0 415 0Q410 0 363 1T228 2Q99 2 64 0H49Q43 6 43 9T45 27Q49 40 55 46H83H94Q174 46 189 55Q190 56 191 56Q196 59 201 76T241 233Q258 301 269 344Q339 619 339 625Q339 630 310 630H279Q212 630 191 624Q146 614 121 583T67 467Q60 445 57 441T43 437H40Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">。这种解耦方式中：</span><span style="cursor:pointer;" data-formula="V_0"><span data-formula="V_0"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 986.6 848.6" aria-hidden="true" style="vertical-align: -0.375ex;width: 2.232ex;height: 1.92ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="56" d="M52 648Q52 670 65 683H76Q118 680 181 680Q299 680 320 683H330Q336 677 336 674T334 656Q329 641 325 637H304Q282 635 274 635Q245 630 242 620Q242 618 271 369T301 118L374 235Q447 352 520 471T595 594Q599 601 599 609Q599 633 555 637Q537 637 537 648Q537 649 539 661Q542 675 545 679T558 683Q560 683 570 683T604 682T668 681Q737 681 755 683H762Q769 676 769 672Q769 655 760 640Q757 637 743 637Q730 636 719 635T698 630T682 623T670 615T660 608T652 599T645 592L452 282Q272 -9 266 -16Q263 -18 259 -21L241 -22H234Q216 -22 216 -15Q213 -9 177 305Q139 623 138 626Q133 637 76 637H59Q52 642 52 648Z"></path></g><g data-mml-node="mn" transform="translate(583, -150) scale(0.707)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 负责提供静态的形状特征，而 </span><span style="cursor:pointer;" data-formula="V_T"><span data-formula="V_T"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 1130.8 833" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.558ex;height: 1.885ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="56" d="M52 648Q52 670 65 683H76Q118 680 181 680Q299 680 320 683H330Q336 677 336 674T334 656Q329 641 325 637H304Q282 635 274 635Q245 630 242 620Q242 618 271 369T301 118L374 235Q447 352 520 471T595 594Q599 601 599 609Q599 633 555 637Q537 637 537 648Q537 649 539 661Q542 675 545 679T558 683Q560 683 570 683T604 682T668 681Q737 681 755 683H762Q769 676 769 672Q769 655 760 640Q757 637 743 637Q730 636 719 635T698 630T682 623T670 615T660 608T652 599T645 592L452 282Q272 -9 266 -16Q263 -18 259 -21L241 -22H234Q216 -22 216 -15Q213 -9 177 305Q139 623 138 626Q133 637 76 637H59Q52 642 52 648Z"></path></g><g data-mml-node="mi" transform="translate(583, -150) scale(0.707)"><path data-c="54" d="M40 437Q21 437 21 445Q21 450 37 501T71 602L88 651Q93 669 101 677H569H659Q691 677 697 676T704 667Q704 661 687 553T668 444Q668 437 649 437Q640 437 637 437T631 442L629 445Q629 451 635 490T641 551Q641 586 628 604T573 629Q568 630 515 631Q469 631 457 630T439 622Q438 621 368 343T298 60Q298 48 386 46Q418 46 427 45T436 36Q436 31 433 22Q429 4 424 1L422 0Q419 0 415 0Q410 0 363 1T228 2Q99 2 64 0H49Q43 6 43 9T45 27Q49 40 55 46H83H94Q174 46 189 55Q190 56 191 56Q196 59 201 76T241 233Q258 301 269 344Q339 619 339 625Q339 630 310 630H279Q212 630 191 624Q146 614 121 583T67 467Q60 445 57 441T43 437H40Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 则专注于捕捉运动分布。为了支持变长生成，研究者引入了以下核心设计：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">分块处理（Chunk-based processing）</span></b><span leaf="">：将相对轨迹 </span><span style="cursor:pointer;" data-formula="V_T"><span data-formula="V_T"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 1130.8 833" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.558ex;height: 1.885ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="56" d="M52 648Q52 670 65 683H76Q118 680 181 680Q299 680 320 683H330Q336 677 336 674T334 656Q329 641 325 637H304Q282 635 274 635Q245 630 242 620Q242 618 271 369T301 118L374 235Q447 352 520 471T595 594Q599 601 599 609Q599 633 555 637Q537 637 537 648Q537 649 539 661Q542 675 545 679T558 683Q560 683 570 683T604 682T668 681Q737 681 755 683H762Q769 676 769 672Q769 655 760 640Q757 637 743 637Q730 636 719 635T698 630T682 623T670 615T660 608T652 599T645 592L452 282Q272 -9 266 -16Q263 -18 259 -21L241 -22H234Q216 -22 216 -15Q213 -9 177 305Q139 623 138 626Q133 637 76 637H59Q52 642 52 648Z"></path></g><g data-mml-node="mi" transform="translate(583, -150) scale(0.707)"><path data-c="54" d="M40 437Q21 437 21 445Q21 450 37 501T71 602L88 651Q93 669 101 677H569H659Q691 677 697 676T704 667Q704 661 687 553T668 444Q668 437 649 437Q640 437 637 437T631 442L629 445Q629 451 635 490T641 551Q641 586 628 604T573 629Q568 630 515 631Q469 631 457 630T439 622Q438 621 368 343T298 60Q298 48 386 46Q418 46 427 45T436 36Q436 31 433 22Q429 4 424 1L422 0Q419 0 415 0Q410 0 363 1T228 2Q99 2 64 0H49Q43 6 43 9T45 27Q49 40 55 46H83H94Q174 46 189 55Q190 56 191 56Q196 59 201 76T241 233Q258 301 269 344Q339 619 339 625Q339 630 310 630H279Q212 630 191 624Q146 614 121 583T67 467Q60 445 57 441T43 437H40Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 切分为有重叠的块（Chunks）。每个块独立进行压缩和解压，这使得显存开销不再随序列长度呈指数增长。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">时间相关梯度加权（Time-Dependent Gradient Weighting, TDGW）</span></b><span leaf="">：这是为了解决块与块之间可能出现的“跳变”问题。在重叠区域，模型通过线性插值平滑权重 </span><span style="cursor:pointer;" data-formula="W(t)"><span data-formula="W(t)"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2187 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 4.948ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="57" d="M436 683Q450 683 486 682T553 680Q604 680 638 681T677 682Q695 682 695 674Q695 670 692 659Q687 641 683 639T661 637Q636 636 621 632T600 624T597 615Q597 603 613 377T629 138L631 141Q633 144 637 151T649 170T666 200T690 241T720 295T759 362Q863 546 877 572T892 604Q892 619 873 628T831 637Q817 637 817 647Q817 650 819 660Q823 676 825 679T839 682Q842 682 856 682T895 682T949 681Q1015 681 1034 683Q1048 683 1048 672Q1048 666 1045 655T1038 640T1028 637Q1006 637 988 631T958 617T939 600T927 584L923 578L754 282Q586 -14 585 -15Q579 -22 561 -22Q546 -22 542 -17Q539 -14 523 229T506 480L494 462Q472 425 366 239Q222 -13 220 -15T215 -19Q210 -22 197 -22Q178 -22 176 -15Q176 -12 154 304T131 622Q129 631 121 633T82 637H58Q51 644 51 648Q52 671 64 683H76Q118 680 176 680Q301 680 313 683H323Q329 677 329 674T327 656Q322 641 318 637H297Q236 634 232 620Q262 160 266 136L501 550L499 587Q496 629 489 632Q483 636 447 637Q428 637 422 639T416 648Q416 650 418 660Q419 664 420 669T421 676T424 680T428 682T436 683Z"></path></g><g data-mml-node="mo" transform="translate(1048, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1437, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(1798, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></span></span><span leaf="">，确保了长动画在拼接处的连贯性。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">同步注意力（Sync Attention）</span></b><span leaf="">：传统的注意力机制容易导致空间和时间特征的混淆。Sync Attention 通过利用顶点特征生成的注意力图来引导轨迹特征的投影，实现了几何与运动特征的解耦建模，防止了信息“打架”。</span></p></li></ul><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">破解“粘连”难题：PLTA 注意力</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在 4D 生成中，一个常见的诡异现象是“轨迹粘连（Trajectory Sticking）”——比如角色的手在挥动时，由于空间距离太近，手部的顶点会“带着”头部的顶点一起跑，导致模型变形。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="轨迹粘连示意图，展示了空间邻近点在运动时的错误牵连" class="rich_pages wxw-img" data-ratio="0.5048192771084338" data-type="png" data-w="830" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175618" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=f75f9699&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWib3y1ANB8YcK2GJnBGZjMULt6dZ8n0m4FyWaz76TyJibicfn0zhCAgMWWsZcWzr21H7iaNmfLYkxvoY0rmMwdG1ic9JAzfzN4W6Sus%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">轨迹粘连示意图，展示了空间邻近点在运动时的错误牵连</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了解决这一痛点，团队提出了 </span><b><span leaf="">幂律拓扑感知注意力（Power-Law Topology-Aware Attention, PLTA）</span></b><span leaf="">。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">原理</span></b><span leaf="">：利用网格的 1-hop 邻接矩阵 </span><span style="cursor:pointer;" data-formula="H_1"><span data-formula="H_1"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 1234.6 833" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.793ex;height: 1.885ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="48" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 219 683Q260 681 355 681Q389 681 418 681T463 682T483 682Q499 682 499 672Q499 670 497 658Q492 641 487 638H485Q483 638 480 638T473 638T464 637T455 637Q416 636 405 634T387 623Q384 619 355 500Q348 474 340 442T328 395L324 380Q324 378 469 378H614L615 381Q615 384 646 504Q674 619 674 627T617 637Q594 637 587 639T580 648Q580 650 582 660Q586 677 588 679T604 682Q609 682 646 681T740 680Q802 680 835 681T871 682Q888 682 888 672Q888 645 876 638H874Q872 638 869 638T862 638T853 637T844 637Q805 636 794 634T776 623Q773 618 704 340T634 58Q634 51 638 51Q646 48 692 46H723Q729 38 729 37T726 19Q722 6 716 0H701Q664 2 567 2Q533 2 504 2T458 2T437 1Q420 1 420 10Q420 15 423 24Q428 43 433 45Q437 46 448 46H454Q481 46 514 49Q520 50 522 50T528 55T534 64T540 82T547 110T558 153Q565 181 569 198Q602 330 602 331T457 332H312L279 197Q245 63 245 58Q245 51 253 49T303 46H334Q340 38 340 37T337 19Q333 6 327 0H312Q275 2 178 2Q144 2 115 2T69 2T48 1Q31 1 31 10Q31 12 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mn" transform="translate(831, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">，通过矩阵幂次运算迭代计算连通带：</span><span style="cursor:pointer;" data-formula="C_{2^L} = \text{Boolean}(C_{2^{L-1}} \cdot C_{2^{L-1}}) \lor C_{2^{L-1}}"><span data-formula="C_{2^L} = \text{Boolean}(C_{2^{L-1}} \cdot C_{2^{L-1}}) \lor C_{2^{L-1}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 15326.1 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 34.674ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="TeXAtom" transform="translate(715, -244.6) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msup"><g data-mml-node="mn"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="mi" transform="translate(500, 363) scale(0.707)"><path data-c="4C" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 217 683Q271 680 344 680Q485 680 506 683H518Q524 677 524 674T522 656Q517 641 513 637H475Q406 636 394 628Q387 624 380 600T313 336Q297 271 279 198T252 88L243 52Q243 48 252 48T311 46H328Q360 46 379 47T428 54T478 72T522 106T564 161Q580 191 594 228T611 270Q616 273 628 273H641Q647 264 647 262T627 203T583 83T557 9Q555 4 553 3T537 0T494 -1Q483 -1 418 -1T294 0H116Q32 0 32 10Q32 17 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g></g></g></g><g data-mml-node="mo" transform="translate(1772.2, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mtext" transform="translate(2828, 0)"><path data-c="42" d="M131 622Q124 629 120 631T104 634T61 637H28V683H229H267H346Q423 683 459 678T531 651Q574 627 599 590T624 512Q624 461 583 419T476 360L466 357Q539 348 595 302T651 187Q651 119 600 67T469 3Q456 1 242 0H28V46H61Q103 47 112 49T131 61V622ZM511 513Q511 560 485 594T416 636Q415 636 403 636T371 636T333 637Q266 637 251 636T232 628Q229 624 229 499V374H312L396 375L406 377Q410 378 417 380T442 393T474 417T499 456T511 513ZM537 188Q537 239 509 282T430 336L329 337H229V200V116Q229 57 234 52Q240 47 334 47H383Q425 47 443 53Q486 67 511 104T537 188Z"></path><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z" transform="translate(708, 0)"></path><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z" transform="translate(1208, 0)"></path><path data-c="6C" d="M42 46H56Q95 46 103 60V68Q103 77 103 91T103 124T104 167T104 217T104 272T104 329Q104 366 104 407T104 482T104 542T103 586T103 603Q100 622 89 628T44 637H26V660Q26 683 28 683L38 684Q48 685 67 686T104 688Q121 689 141 690T171 693T182 694H185V379Q185 62 186 60Q190 52 198 49Q219 46 247 46H263V0H255L232 1Q209 2 183 2T145 3T107 3T57 1L34 0H26V46H42Z" transform="translate(1708, 0)"></path><path data-c="65" d="M28 218Q28 273 48 318T98 391T163 433T229 448Q282 448 320 430T378 380T406 316T415 245Q415 238 408 231H126V216Q126 68 226 36Q246 30 270 30Q312 30 342 62Q359 79 369 104L379 128Q382 131 395 131H398Q415 131 415 121Q415 117 412 108Q393 53 349 21T250 -11Q155 -11 92 58T28 218ZM333 275Q322 403 238 411H236Q228 411 220 410T195 402T166 381T143 340T127 274V267H333V275Z" transform="translate(1986, 0)"></path><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z" transform="translate(2430, 0)"></path><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(2930, 0)"></path></g><g data-mml-node="mo" transform="translate(6314, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(6703, 0)"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="TeXAtom" transform="translate(715, -244.6) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msup"><g data-mml-node="mn"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="TeXAtom" transform="translate(500, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 217 683Q271 680 344 680Q485 680 506 683H518Q524 677 524 674T522 656Q517 641 513 637H475Q406 636 394 628Q387 624 380 600T313 336Q297 271 279 198T252 88L243 52Q243 48 252 48T311 46H328Q360 46 379 47T428 54T478 72T522 106T564 161Q580 191 594 228T611 270Q616 273 628 273H641Q647 264 647 262T627 203T583 83T557 9Q555 4 553 3T537 0T494 -1Q483 -1 418 -1T294 0H116Q32 0 32 10Q32 17 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mo" transform="translate(681, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(1459, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g></g><g data-mml-node="mo" transform="translate(9058.6, 0)"><path data-c="22C5" d="M78 250Q78 274 95 292T138 310Q162 310 180 294T199 251Q199 226 182 208T139 190T96 207T78 250Z"></path></g><g data-mml-node="msub" transform="translate(9558.8, 0)"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="TeXAtom" transform="translate(715, -244.6) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msup"><g data-mml-node="mn"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="TeXAtom" transform="translate(500, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 217 683Q271 680 344 680Q485 680 506 683H518Q524 677 524 674T522 656Q517 641 513 637H475Q406 636 394 628Q387 624 380 600T313 336Q297 271 279 198T252 88L243 52Q243 48 252 48T311 46H328Q360 46 379 47T428 54T478 72T522 106T564 161Q580 191 594 228T611 270Q616 273 628 273H641Q647 264 647 262T627 203T583 83T557 9Q555 4 553 3T537 0T494 -1Q483 -1 418 -1T294 0H116Q32 0 32 10Q32 17 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mo" transform="translate(681, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(1459, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g></g><g data-mml-node="mo" transform="translate(11692.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(12303.4, 0)"><path data-c="2228" d="M55 580Q56 587 61 592T75 598Q86 598 96 580L333 48L570 580Q579 596 586 597Q588 598 591 598Q609 598 611 580Q611 574 546 426T415 132T348 -15Q343 -22 333 -22T318 -15Q317 -14 252 131T121 425T55 580Z"></path></g><g data-mml-node="msub" transform="translate(13192.7, 0)"><g data-mml-node="mi"><path data-c="43" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q484 659 454 652T382 628T299 572T226 479Q194 422 175 346T156 222Q156 108 232 58Q280 24 350 24Q441 24 512 92T606 240Q610 253 612 255T628 257Q648 257 648 248Q648 243 647 239Q618 132 523 55T319 -22Q206 -22 128 53T50 252Z"></path></g><g data-mml-node="TeXAtom" transform="translate(715, -244.6) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msup"><g data-mml-node="mn"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="TeXAtom" transform="translate(500, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 217 683Q271 680 344 680Q485 680 506 683H518Q524 677 524 674T522 656Q517 641 513 637H475Q406 636 394 628Q387 624 380 600T313 336Q297 271 279 198T252 88L243 52Q243 48 252 48T311 46H328Q360 46 379 47T428 54T478 72T522 106T564 161Q580 191 594 228T611 270Q616 273 628 273H641Q647 264 647 262T627 203T583 83T557 9Q555 4 553 3T537 0T494 -1Q483 -1 418 -1T294 0H116Q32 0 32 10Q32 17 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mo" transform="translate(681, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(1459, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">效果</span></b><span leaf="">：这种设计让模型能以指数级速度扩大每个顶点的局部感受野。结合显式注入的 </span><b><span leaf="">顶点法线（Vertex Normal Injection）</span></b><span leaf="">，模型能精准区分“空间邻近但拓扑遥远”的区域（如手和头），极大地提升了局部几何的保持能力。</span></p></li></ul><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">文本驱动生成：SGTT 模型</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了将文字指令转化为动作，研究者设计了 </span><b><span leaf="">形状引导文本转轨迹模型（Shape-Guided Text-to-Trajectory, SGTT）</span></b><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="SGTT 模型架构，基于 DiT 并引入了修正流采样" class="rich_pages wxw-img" data-ratio="1.338785046728972" data-type="png" data-w="856" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175615" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=75d69697&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW90LkibDFMjUnMlX3GqU2W8W47nib8eTShL32Jse3ZT3erWQdVuL0QibVdicNHzS8En79lWQdUKWLPkIQJ5VahA1v648WA3jiah0SkE%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">SGTT 模型架构，基于 DiT 并引入了修正流采样</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">该模型基于 Transformer 架构，采用 </span><b><span leaf="">修正流（Rectified Flow, RF）</span></b><span leaf=""> 训练策略。它的 </span><b><span leaf="">Input</span></b><span leaf=""> 是压缩后的轨迹潜码、初始网格特征和文本嵌入，</span><b><span leaf="">Output</span></b><span leaf=""> 则是预测的运动速度场。通过交替使用空间自注意力、时间自注意力和文本交叉注意力，模型在潜空间中高效学习轨迹分布。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">史上最大 4D 网格数据集：DyMesh-XL</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">巧妇难为无米之炊。为了支撑基础模型的训练，团队构建了目前规模最大的动态网格数据集 </span><b><span leaf="">DyMesh-XL</span></b><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="DyMesh-XL 数据集概览，展示了其丰富的数据来源和类别分布" class="rich_pages wxw-img" data-ratio="0.537962962962963" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175622" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=754c174f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicRDPicznn8E43wBwzyzljPokuhaibAns92yTBxyg5Z79YElbumNSicgypeIY9kiaRrQSYa7ianGvOpGMYWuZkubswdWIkK8gJ1liaD8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">DyMesh-XL 数据集概览，展示了其丰富的数据来源和类别分布</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">该数据集整合了 Objaverse-XL、AMASS、DeformingThings4D 等多个来源，涵盖了约 </span><font color="#0000FF"><b><span leaf="">30万</span></b></font><span leaf=""> 个独立身份和超过 </span><font color="#0000FF"><b><span leaf="">400万</span></b></font><span leaf=""> 段动态序列。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了提升文本-动作的对齐质量，研究者利用 </span><b><span leaf="">Qwen-2.5-VL</span></b><span leaf=""> 等多模态大模型对渲染后的视频进行了自动标注。这种大规模、高质量的数据喂养，是 AnimateAnyMesh++ 能够处理复杂动作（如跳舞、挥翅膀）的关键。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果：刷新 SOTA，秒级推理</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在与 DreamGaussian4D、Animate3D 等主流方法的对比中，AnimateAnyMesh++ 展现出了压倒性的优势。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="定性对比图，展示了不同模型在相同 Prompt 下的生成效果" class="rich_pages wxw-img" data-ratio="0.9694444444444444" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175620" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=7f72ecae&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibviaYcQ28Sa3U8HICJllWzbW64ibJA0XvIdy0ibibPB2zAwm9CBuI8BibRGZ21QbDImyHeRplfRMyTpIdHwpBXvt2SicrVbXwGT4yMs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">定性对比图，展示了不同模型在相同 Prompt 下的生成效果</span></figcaption></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">动作幅度与准确性</span></b><span leaf="">：如上图所示，无论是“角色跳跃”还是“龙挥动翅膀”，新模型生成的动作幅度更大、语义对齐更精准，且没有明显的几何畸变。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">性能指标</span></b><span leaf="">：在定量评估中，AnimateAnyMesh++ 在平均移动距离（AMD）上达到了 </span><font color="#0000FF"><b><span leaf="">0.0043</span></b></font><span leaf="">，远超 Animate3D 的 0.0011。这意味着它能生成更“大幅度”的动作，同时保持了极低的异常边缘率（</span><span style="cursor:pointer;" data-formula="\rho_{abn}^2 = 0.0050"><span data-formula="\rho_{abn}^2 = 0.0050"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -833.9 5780.2 1149.4" aria-hidden="true" style="vertical-align: -0.714ex;width: 13.077ex;height: 2.601ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="mi"><path data-c="3C1" d="M58 -216Q25 -216 23 -186Q23 -176 73 26T127 234Q143 289 182 341Q252 427 341 441Q343 441 349 441T359 442Q432 442 471 394T510 276Q510 219 486 165T425 74T345 13T266 -10H255H248Q197 -10 165 35L160 41L133 -71Q108 -168 104 -181T92 -202Q76 -216 58 -216ZM424 322Q424 359 407 382T357 405Q322 405 287 376T231 300Q217 269 193 170L176 102Q193 26 260 26Q298 26 334 62Q367 92 389 158T418 266T424 322Z"></path></g><g data-mml-node="mn" transform="translate(517, 363) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="TeXAtom" transform="translate(517, -307.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="61" d="M33 157Q33 258 109 349T280 441Q331 441 370 392Q386 422 416 422Q429 422 439 414T449 394Q449 381 412 234T374 68Q374 43 381 35T402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487Q506 153 506 144Q506 138 501 117T481 63T449 13Q436 0 417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157ZM351 328Q351 334 346 350T323 385T277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q217 26 254 59T298 110Q300 114 325 217T351 328Z"></path></g><g data-mml-node="mi" transform="translate(529, 0)"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g><g data-mml-node="mi" transform="translate(958, 0)"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g></g></g><g data-mml-node="mo" transform="translate(1946.5, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(3002.2, 0)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path><path data-c="2E" d="M78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z" transform="translate(500, 0)"></path><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z" transform="translate(778, 0)"></path><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z" transform="translate(1278, 0)"></path><path data-c="35" d="M164 157Q164 133 148 117T109 101H102Q148 22 224 22Q294 22 326 82Q345 115 345 210Q345 313 318 349Q292 382 260 382H254Q176 382 136 314Q132 307 129 306T114 304Q97 304 95 310Q93 314 93 485V614Q93 664 98 664Q100 666 102 666Q103 666 123 658T178 642T253 634Q324 634 389 662Q397 666 402 666Q410 666 410 648V635Q328 538 205 538Q174 538 149 544L139 546V374Q158 388 169 396T205 412T256 420Q337 420 393 355T449 201Q449 109 385 44T229 -22Q148 -22 99 32T50 154Q50 178 61 192T84 210T107 214Q132 214 148 197T164 157Z" transform="translate(1778, 0)"></path><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z" transform="translate(2278, 0)"></path></g></g></g><g></g></svg></span></span><span leaf="">），证明了其结构的稳定性。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">推理速度</span></b><span leaf="">：作为前向推理模型，它生成 16 帧动画仅需 </span><b><span leaf="">7.3秒</span></b><span leaf="">，即便扩展到 64 帧也只需 </span><b><span leaf="">13.5秒</span></b><span leaf="">。相比动辄需要十几分钟优化的旧方法，效率提升了百倍。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="定量对比表，展示了视频指标与 4D 几何指标的全面领先" class="rich_pages wxw-img" data-ratio="0.5464414957780458" data-type="png" data-w="829" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175619" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=9751da3a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8cJQ1of5GA8IdsicG0KIjrtNQI7Q7mcFh8JSDDEC5yErTW6wcocwia9ibm3N3805kzMan7S3NuMEgSDD5YShWGwb1L4QIibLoQnuk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">定量对比表，展示了视频指标与 4D 几何指标的全面领先</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">值得一提的是，该模型的训练动用了 32 张 H20 GPU，而推理仅需单张 </span><b><span leaf="">A800</span></b><span leaf=""> 即可实现秒级响应，这为未来的实时 4D 创作提供了可能。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">AnimateAnyMesh++ 的出现，标志着 4D 内容生成正在从“单例优化”时代迈向“通用大模型”时代。其核心价值不仅在于那几个百分点的指标提升，更在于它构建了一套完整的、可扩展的 4D 训练管线。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前的 4D 数据规模相比视频仍有差距，且 VLM 对动态动作的描述精度仍有提升空间。面向未来，或许 AnimateAnyMesh++ 能为更多工作带来启发。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.125" data-type="gif" data-w="960" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-imgfileid="100175621" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=6464f1fb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGWicoSTC2Zv5BJkFFY7qFNatpEo1IQTYxib4Lo8xl4aXPia6Sg7kTPj5cFIBPicEfNQuaRniagZfZxiak0ZfrZEk0aicS2PQNxSexDuw1g%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-ratio="0.7064814814814815" data-type="png" data-w="1080" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-imgfileid="100175623" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=0bde3874&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9VcpzFG6MGGBbKBUtBjCTVmzflhchiaHfZrkgaiaflaia2iciblWFAKcdSRicZ7dZBmTZFOoUJtuECPYBhm04Me2rxib3R0RCdns2c8A%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></p></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=fbde86d0&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659274%26idx%3D1%26sn%3D6deafcaa909bcfebef3baa2c060b5969">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Thu, 30 Apr 2026 23:20:00 +0800</pubDate>
    </item>
    <item>
      <title>清华&amp;淘宝直播开源CoInteract：双流协同生成，实现物理一致的人物交互</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659257&amp;idx=1&amp;sn=0d1033d4cd6d245a69e334d2f74c72cd</link>
      <description>更真实、更懂交互的视频生成</description>
      <content:encoded><![CDATA[<p>原创 <span>CV君</span> <span>2026-04-29 19:54</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=a4588b6c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWic7tcicMXOYI4DXwP611UKru5uAzdOeONLMtGWyZD1k4CLs1Cs6kvk0f7jDVmGH7ia9gichlVECxDQ2Jedqia4EmWjpPKLpOtw1hic8%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>更真实、更懂交互的视频生成</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175560" data-ratio="0.2778649921507064" data-type="gif" data-w="637" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=06a03403&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGWichRWLroib7r2pOX96uMgBnjt6VV7Qoxia0icrO7W6hHHdSmqLIX635ezmdGiaVtzZ97tibIv6MWCjZuotT2qbQgXESbbuHaFLyhn1c%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在视频生成技术突飞猛进的今天，我们已经能看到非常逼真的数字人说话视频。但当场景从“坐着说话”变成“拿起产品演示”时，AI 往往就开始露怯了：手部可能会穿过包包的表面，或者手指在抓握时变得模糊不清。这种人与物体交互（Human-Object Interaction, HOI）的物理不一致性，一直是视频生成领域的顽疾。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">近日，来自清华大学和阿里巴巴淘宝直播的研究团队提出了一种名为 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">CoInteract</span></strong><span leaf=""> 的端到端框架，结合了 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Co</span></strong><span leaf="">-Generation（协同生成）与 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Interact</span></strong><span leaf="">ion（交互）两个概念，旨在通过空间结构协同生成的范式，让 AI 视频不仅好看，更要符合物理规律。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175556" data-ratio="0.40185185185185185" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=228d8637&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8M0FKKZADTs6EvicCw45SrNtIoICsiaUx4kAV821NleESezNY3jlrBg5g6Uiazs2SpOsSI6c19Otqx1AmKKgEYvk9Ie9icrzIoTxs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2604.19636" target="_blank">https://arxiv.org/abs/2604.19636</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">项目主页</span></b><span leaf="">: <a href="https://xinxiaozhe12345.github.io/CoInteract_Project" target="_blank">https://xinxiaozhe12345.github.io/CoInteract_Project</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">代码仓库</span></b><span leaf="">: <a href="https://github.com/luoxyhappy/cointeract" target="_blank">https://github.com/luoxyhappy/cointeract</a></span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">值得一提的是，作者已经在有序推进开源，相关论文在 Huggingface Daily Paper取得了日榜第二，周榜第四的排名，可见业界对其的关注热度。</span></p><p></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">为什么 AI 总是学不会“拿东西”？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在电商直播领域，合成人物与物体交互（Human-Object Interaction, HOI）应用——允许用户仅提供一张人物参考图、一张商品参考图和文本描述，即可生成逼真的商品展示视频，而无需实际拍摄。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">而目前的人-物交互视频生成难以满足这样的需求。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前的视频扩散模型大多是“以像素为中心”的。模型在训练时只学习怎么看起来更像照片，但它脑子里并没有“3D 空间”和“物理边界”的概念。这就导致了两个典型失败案例：一是</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">结构崩溃</span></strong><span leaf="">，比如手指抓握时融合在一起；二是</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">物理违和</span></strong><span leaf="">，比如手直接穿透了物体表面（即“穿模”）。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">现有的方法要么依赖沉重的推理时预处理（如提取每一帧的精确姿态），要么缺乏对交互结构的显式约束。CoInteract 的出现，就是想把“结构先验”和“物理约束”直接植入生成模型的大脑——Diffusion Transformer (DiT) 的骨干网络里。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="CoInteract 与现有生成范式的对比，展示了其端到端、易用且感知结构的优势" class="rich_pages wxw-img" data-ratio="0.9879629629629629" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175559" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=a1d20d66&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9cee7icibGLjkxyMLibnYKAITBETT7GXQumuBbbS0HZY99p3zZib35YwiaZHdpXBKltIIiavadgzP8nEuUlgGkeIDB8vRow8w1c3wtI%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">CoInteract 与现有生成范式的对比，展示了其端到端、易用且感知结构的优势</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">方法详解：给 DiT 装上“物理外挂”</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">CoInteract 主要由两个互补的设计组成：</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">空间结构协同生成(Spatially-Structured Co-Generation)</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">和</span></strong><span leaf="">人体感知专家混合模块（Human-Aware Mixture-of-Experts, MoE）</span></strong><span leaf="">。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 双流协同生成：让 AI 边画图边想结构</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队引入了一个辅助的“HOI 结构流”。简单来说，模型在训练时不仅要生成彩色的 RGB 视频，还要同步生成一个只有剪影和物体掩码的结构图。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">Input（输入）</span></b><span leaf="">：包括人物身份参考图 </span><span style="cursor:pointer;" data-formula="\mathcal{I}_{ref}"><span data-formula="\mathcal{I}_{ref}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 1632.3 978" aria-hidden="true" style="vertical-align: -0.667ex;width: 3.693ex;height: 2.213ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="49" d="M174 0H31Q-13 0 -21 2T-30 12Q-30 23 -17 36Q9 60 42 68L155 70Q187 102 214 179T257 333T302 491T366 610L369 614H305Q221 611 188 607T145 596T128 569Q119 543 94 529T47 512Q28 512 28 524Q28 527 32 539Q56 614 159 654Q218 678 312 682Q314 682 339 682T404 682T481 683H632Q642 678 642 671Q642 657 621 641T577 617Q570 615 507 614H444Q427 592 406 542Q382 478 355 366T310 209Q280 123 238 78L230 69H330Q442 70 442 74Q443 74 443 77T447 87T460 105Q490 134 527 137Q545 137 545 125Q545 120 542 112Q531 78 491 49T399 7Q379 2 360 2T174 0Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(545, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(451, 0)"><path data-c="65" d="M39 168Q39 225 58 272T107 350T174 402T244 433T307 442H310Q355 442 388 420T421 355Q421 265 310 237Q261 224 176 223Q139 223 138 221Q138 219 132 186T125 128Q125 81 146 54T209 26T302 45T394 111Q403 121 406 121Q410 121 419 112T429 98T420 82T390 55T344 24T281 -1T205 -11Q126 -11 83 42T39 168ZM373 353Q367 405 305 405Q272 405 244 391T199 357T170 316T154 280T149 261Q149 260 169 260Q282 260 327 284T373 353Z"></path></g><g data-mml-node="mi" transform="translate(917, 0)"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">、产品参考图 </span><span style="cursor:pointer;" data-formula="\mathcal{I}_{prod}"><span data-formula="\mathcal{I}_{prod}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 1980.2 970.2" aria-hidden="true" style="vertical-align: -0.65ex;width: 4.48ex;height: 2.195ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="49" d="M174 0H31Q-13 0 -21 2T-30 12Q-30 23 -17 36Q9 60 42 68L155 70Q187 102 214 179T257 333T302 491T366 610L369 614H305Q221 611 188 607T145 596T128 569Q119 543 94 529T47 512Q28 512 28 524Q28 527 32 539Q56 614 159 654Q218 678 312 682Q314 682 339 682T404 682T481 683H632Q642 678 642 671Q642 657 621 641T577 617Q570 615 507 614H444Q427 592 406 542Q382 478 355 366T310 209Q280 123 238 78L230 69H330Q442 70 442 74Q443 74 443 77T447 87T460 105Q490 134 527 137Q545 137 545 125Q545 120 542 112Q531 78 491 49T399 7Q379 2 360 2T174 0Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(545, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="70" d="M23 287Q24 290 25 295T30 317T40 348T55 381T75 411T101 433T134 442Q209 442 230 378L240 387Q302 442 358 442Q423 442 460 395T497 281Q497 173 421 82T249 -10Q227 -10 210 -4Q199 1 187 11T168 28L161 36Q160 35 139 -51T118 -138Q118 -144 126 -145T163 -148H188Q194 -155 194 -157T191 -175Q188 -187 185 -190T172 -194Q170 -194 161 -194T127 -193T65 -192Q-5 -192 -24 -194H-32Q-39 -187 -39 -183Q-37 -156 -26 -148H-6Q28 -147 33 -136Q36 -130 94 103T155 350Q156 355 156 364Q156 405 131 405Q109 405 94 377T71 316T59 280Q57 278 43 278H29Q23 284 23 287ZM178 102Q200 26 252 26Q282 26 310 49T356 107Q374 141 392 215T411 325V331Q411 405 350 405Q339 405 328 402T306 393T286 380T269 365T254 350T243 336T235 326L232 322Q232 321 229 308T218 264T204 212Q178 106 178 102Z"></path></g><g data-mml-node="mi" transform="translate(503, 0)"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(954, 0)"><path data-c="6F" d="M201 -11Q126 -11 80 38T34 156Q34 221 64 279T146 380Q222 441 301 441Q333 441 341 440Q354 437 367 433T402 417T438 387T464 338T476 268Q476 161 390 75T201 -11ZM121 120Q121 70 147 48T206 26Q250 26 289 58T351 142Q360 163 374 216T388 308Q388 352 370 375Q346 405 306 405Q243 405 195 347Q158 303 140 230T121 120Z"></path></g><g data-mml-node="mi" transform="translate(1439, 0)"><path data-c="64" d="M366 683Q367 683 438 688T511 694Q523 694 523 686Q523 679 450 384T375 83T374 68Q374 26 402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487H491Q506 153 506 145Q506 140 503 129Q490 79 473 48T445 8T417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157Q33 205 53 255T101 341Q148 398 195 420T280 442Q336 442 364 400Q369 394 369 396Q370 400 396 505T424 616Q424 629 417 632T378 637H357Q351 643 351 645T353 664Q358 683 366 683ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">、文本提示词、语音音频，以及为了保证连贯性的历史运动帧 </span><span style="cursor:pointer;" data-formula="\mathcal{V}_{mot}"><span data-formula="\mathcal{V}_{mot}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 1882.1 840.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 4.258ex;height: 1.902ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="56" d="M25 633Q25 647 47 665T100 683Q291 683 291 306Q291 264 288 213T282 132L279 102Q281 102 308 126T378 191T464 279T545 381T596 479Q600 490 600 502Q600 527 581 550T523 577Q505 577 505 601Q505 622 516 647T542 681Q546 683 558 683Q605 679 631 645T658 559Q658 423 487 215Q409 126 308 37T190 -52Q177 -52 177 -28Q177 -26 183 15T196 127T203 270Q203 356 192 421T165 523T126 583T83 613T41 620Q25 620 25 633Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(613, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="6D" d="M21 287Q22 293 24 303T36 341T56 388T88 425T132 442T175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q303 442 384 442Q401 442 415 440T441 433T460 423T475 411T485 398T493 385T497 373T500 364T502 357L510 367Q573 442 659 442Q713 442 746 415T780 336Q780 285 742 178T704 50Q705 36 709 31T724 26Q752 26 776 56T815 138Q818 149 821 151T837 153Q857 153 857 145Q857 144 853 130Q845 101 831 73T785 17T716 -10Q669 -10 648 17T627 73Q627 92 663 193T700 345Q700 404 656 404H651Q565 404 506 303L499 291L466 157Q433 26 428 16Q415 -11 385 -11Q372 -11 364 -4T353 8T350 18Q350 29 384 161L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 181Q151 335 151 342Q154 357 154 369Q154 405 129 405Q107 405 92 377T69 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(878, 0)"><path data-c="6F" d="M201 -11Q126 -11 80 38T34 156Q34 221 64 279T146 380Q222 441 301 441Q333 441 341 440Q354 437 367 433T402 417T438 387T464 338T476 268Q476 161 390 75T201 -11ZM121 120Q121 70 147 48T206 26Q250 26 289 58T351 142Q360 163 374 216T388 308Q388 352 370 375Q346 405 306 405Q243 405 195 347Q158 303 140 230T121 120Z"></path></g><g data-mml-node="mi" transform="translate(1363, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">Output（输出）</span></b><span leaf="">：高保真的 RGB 交互视频。在训练阶段，还会输出对应的 HOI 结构流视频。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了让这个过程更高效，作者设计了</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">非对称协同注意力（Asymmetric Co-Attention）</span></strong><span leaf="">机制。在训练的第一阶段，两个流完全互通，建立耦合；到了第二阶段，通过一个特殊的掩码 </span><span style="cursor:pointer;" data-formula="\mathbf{M}"><span data-formula="\mathbf{M}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -686 1092 686" aria-hidden="true" style="vertical-align: 0px;width: 2.471ex;height: 1.552ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4D" d="M314 0Q296 3 181 3T48 0H39V62H147V624H39V686H305Q316 679 323 667Q330 653 434 414L546 157L658 414Q766 662 773 674Q778 681 788 686H1052V624H944V62H1052V0H1040Q1016 3 874 3T708 0H696V62H804V341L803 618L786 580Q770 543 735 462T671 315Q540 13 536 9Q528 1 507 1Q485 1 477 9Q472 14 408 162T281 457T217 603Q215 603 215 334V62H323V0H314Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">，让 RGB 流的查询（Query）只关注自己，而 HOI 流则可以观察 RGB 流。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="两阶段训练与推理示意图，展示了如何通过掩码实现推理加速" class="rich_pages wxw-img" data-ratio="0.41203703703703703" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175558" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=cb03f873&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicy9ssYPbaxCArv7aQ3aV8iaN89KaahnthyPywoOJhCY1XaYZPZXKafzAySeDxs2q2phBh4BEsznggADoUmdUBOCRGgmTJR2lbs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">两阶段训练与推理示意图，展示了如何通过掩码实现推理加速</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">掩码的逻辑如下：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathbf{M}_{i,j} = \begin{cases} 1, &amp; \text{if } i \in \mathcal{T}_r, j \in \mathcal{T}_r \\ 1, &amp; \text{if } i \in \mathcal{T}_h, j \in \mathcal{T}_r \cup \mathcal{T}_h \\ 0, &amp; \text{otherwise} \end{cases}
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1950 14385.1 3400" aria-hidden="true" style="max-width: 300%;vertical-align: -3.281ex;width: 32.546ex;height: 7.692ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4D" d="M314 0Q296 3 181 3T48 0H39V62H147V624H39V686H305Q316 679 323 667Q330 653 434 414L546 157L658 414Q766 662 773 674Q778 681 788 686H1052V624H944V62H1052V0H1040Q1016 3 874 3T708 0H696V62H804V341L803 618L786 580Q770 543 735 462T671 315Q540 13 536 9Q528 1 507 1Q485 1 477 9Q472 14 408 162T281 457T217 603Q215 603 215 334V62H323V0H314Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(1092, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g></g><g data-mml-node="mo" transform="translate(2151.6, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mrow" transform="translate(3207.4, 0)"><g data-mml-node="mo"><path data-c="23A7" d="M712 899L718 893V876V865Q718 854 704 846Q627 793 577 710T510 525Q510 524 509 521Q505 493 504 349Q504 345 504 334Q504 277 504 240Q504 -2 503 -4Q502 -8 494 -9T444 -10Q392 -10 390 -9Q387 -8 386 -5Q384 5 384 230Q384 262 384 312T383 382Q383 481 392 535T434 656Q510 806 664 892L677 899H712Z" transform="translate(0, 1051)"></path><path data-c="23A9" d="M718 -893L712 -899H677L666 -893Q542 -825 468 -714T385 -476Q384 -466 384 -282Q384 3 385 5L389 9Q392 10 444 10Q486 10 494 9T503 4Q504 2 504 -239V-310V-366Q504 -470 508 -513T530 -609Q546 -657 569 -698T617 -767T661 -812T699 -843T717 -856T718 -876V-893Z" transform="translate(0, -551)"></path><path data-c="23A8" d="M389 1159Q391 1160 455 1160Q496 1160 498 1159Q501 1158 502 1155Q504 1145 504 924Q504 691 503 682Q494 549 425 439T243 259L229 250L243 241Q349 175 421 66T503 -182Q504 -191 504 -424Q504 -600 504 -629T499 -659H498Q496 -660 444 -660T390 -659Q387 -658 386 -655Q384 -645 384 -425V-282Q384 -176 377 -116T342 10Q325 54 301 92T255 155T214 196T183 222T171 232Q170 233 170 250T171 268Q171 269 191 284T240 331T300 407T354 524T383 679Q384 691 384 925Q384 1152 385 1155L389 1159Z" transform="translate(0, 0)"></path><svg width="889" height="81" y="1060" x="0" viewBox="0 14.3 889 81" style="max-width: 300%;"><path data-c="23AA" d="M384 150V266Q384 304 389 309Q391 310 455 310Q496 310 498 309Q502 308 503 298Q504 283 504 150Q504 32 504 12T499 -9H498Q496 -10 444 -10T390 -9Q386 -8 385 2Q384 17 384 150Z" transform="scale(1, 0.398)"></path><g></g></svg><svg width="889" height="81" y="-641" x="0" viewBox="0 14.3 889 81" style="max-width: 300%;"><path data-c="23AA" d="M384 150V266Q384 304 389 309Q391 310 455 310Q496 310 498 309Q502 308 503 298Q504 283 504 150Q504 32 504 12T499 -9H498Q496 -10 444 -10T390 -9Q386 -8 385 2Q384 17 384 150Z" transform="scale(1, 0.398)"></path><g></g></svg></g><g data-mml-node="mtable" transform="translate(889, 0)"><g data-mml-node="mtr" transform="translate(0, 1200)"><g data-mml-node="mtd"><g data-mml-node="mn"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(500, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g><g data-mml-node="mtd" transform="translate(1778, 0)"><g data-mml-node="mtext"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path><path data-c="66" d="M273 0Q255 3 146 3Q43 3 34 0H26V46H42Q70 46 91 49Q99 52 103 60Q104 62 104 224V385H33V431H104V497L105 564L107 574Q126 639 171 668T266 704Q267 704 275 704T289 705Q330 702 351 679T372 627Q372 604 358 590T321 576T284 590T270 627Q270 647 288 667H284Q280 668 273 668Q245 668 223 647T189 592Q183 572 182 497V431H293V385H185V225Q185 63 186 61T189 57T194 54T199 51T206 49T213 48T222 47T231 47T241 46T251 46H282V0H273Z" transform="translate(278, 0)"></path><path data-c="A0" d="" transform="translate(584, 0)"></path></g><g data-mml-node="mi" transform="translate(834, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1456.8, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="msub" transform="translate(2401.6, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="54" d="M49 475Q34 475 34 490Q34 552 106 611T261 681Q272 683 507 683H742Q790 717 816 717Q833 717 833 708Q833 682 795 653T714 615Q691 610 588 609Q490 609 490 607L483 580Q476 554 462 496T435 392Q410 289 395 231T363 116T335 34T309 -15T279 -47T242 -64Q231 -68 218 -68Q203 -68 203 -57Q203 -52 211 -38Q224 -7 234 20T251 66T268 123T283 179T304 261T328 360Q342 415 360 488Q380 567 384 582T397 605Q400 607 401 609H302H244Q200 609 188 607T167 596Q145 572 145 541Q145 520 109 498T49 475Z"></path></g></g><g data-mml-node="mi" transform="translate(545, -150) scale(0.707)"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(3315.5, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(3760.1, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g><g data-mml-node="mo" transform="translate(4449.9, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="msub" transform="translate(5394.7, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="54" d="M49 475Q34 475 34 490Q34 552 106 611T261 681Q272 683 507 683H742Q790 717 816 717Q833 717 833 708Q833 682 795 653T714 615Q691 610 588 609Q490 609 490 607L483 580Q476 554 462 496T435 392Q410 289 395 231T363 116T335 34T309 -15T279 -47T242 -64Q231 -68 218 -68Q203 -68 203 -57Q203 -52 211 -38Q224 -7 234 20T251 66T268 123T283 179T304 261T328 360Q342 415 360 488Q380 567 384 582T397 605Q400 607 401 609H302H244Q200 609 188 607T167 596Q145 572 145 541Q145 520 109 498T49 475Z"></path></g></g><g data-mml-node="mi" transform="translate(545, -150) scale(0.707)"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g></g></g><g data-mml-node="mtr" transform="translate(0, 0)"><g data-mml-node="mtd"><g data-mml-node="mn"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(500, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g><g data-mml-node="mtd" transform="translate(1778, 0)"><g data-mml-node="mtext"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path><path data-c="66" d="M273 0Q255 3 146 3Q43 3 34 0H26V46H42Q70 46 91 49Q99 52 103 60Q104 62 104 224V385H33V431H104V497L105 564L107 574Q126 639 171 668T266 704Q267 704 275 704T289 705Q330 702 351 679T372 627Q372 604 358 590T321 576T284 590T270 627Q270 647 288 667H284Q280 668 273 668Q245 668 223 647T189 592Q183 572 182 497V431H293V385H185V225Q185 63 186 61T189 57T194 54T199 51T206 49T213 48T222 47T231 47T241 46T251 46H282V0H273Z" transform="translate(278, 0)"></path><path data-c="A0" d="" transform="translate(584, 0)"></path></g><g data-mml-node="mi" transform="translate(834, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1456.8, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="msub" transform="translate(2401.6, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="54" d="M49 475Q34 475 34 490Q34 552 106 611T261 681Q272 683 507 683H742Q790 717 816 717Q833 717 833 708Q833 682 795 653T714 615Q691 610 588 609Q490 609 490 607L483 580Q476 554 462 496T435 392Q410 289 395 231T363 116T335 34T309 -15T279 -47T242 -64Q231 -68 218 -68Q203 -68 203 -57Q203 -52 211 -38Q224 -7 234 20T251 66T268 123T283 179T304 261T328 360Q342 415 360 488Q380 567 384 582T397 605Q400 607 401 609H302H244Q200 609 188 607T167 596Q145 572 145 541Q145 520 109 498T49 475Z"></path></g></g><g data-mml-node="mi" transform="translate(545, -150) scale(0.707)"><path data-c="68" d="M137 683Q138 683 209 688T282 694Q294 694 294 685Q294 674 258 534Q220 386 220 383Q220 381 227 388Q288 442 357 442Q411 442 444 415T478 336Q478 285 440 178T402 50Q403 36 407 31T422 26Q450 26 474 56T513 138Q516 149 519 151T535 153Q555 153 555 145Q555 144 551 130Q535 71 500 33Q466 -10 419 -10H414Q367 -10 346 17T325 74Q325 90 361 192T398 345Q398 404 354 404H349Q266 404 205 306L198 293L164 158Q132 28 127 16Q114 -11 83 -11Q69 -11 59 -2T48 16Q48 30 121 320L195 616Q195 629 188 632T149 637H128Q122 643 122 645T124 664Q129 683 137 683Z"></path></g></g><g data-mml-node="mo" transform="translate(3403.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(3848.5, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g><g data-mml-node="mo" transform="translate(4538.3, 0)"><path data-c="2208" d="M84 250Q84 372 166 450T360 539Q361 539 377 539T419 540T469 540H568Q583 532 583 520Q583 511 570 501L466 500Q355 499 329 494Q280 482 242 458T183 409T147 354T129 306T124 272V270H568Q583 262 583 250T568 230H124V228Q124 207 134 177T167 112T231 48T328 7Q355 1 466 0H570Q583 -10 583 -20Q583 -32 568 -40H471Q464 -40 446 -40T417 -41Q262 -41 172 45Q84 127 84 250Z"></path></g><g data-mml-node="msub" transform="translate(5483.1, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="54" d="M49 475Q34 475 34 490Q34 552 106 611T261 681Q272 683 507 683H742Q790 717 816 717Q833 717 833 708Q833 682 795 653T714 615Q691 610 588 609Q490 609 490 607L483 580Q476 554 462 496T435 392Q410 289 395 231T363 116T335 34T309 -15T279 -47T242 -64Q231 -68 218 -68Q203 -68 203 -57Q203 -52 211 -38Q224 -7 234 20T251 66T268 123T283 179T304 261T328 360Q342 415 360 488Q380 567 384 582T397 605Q400 607 401 609H302H244Q200 609 188 607T167 596Q145 572 145 541Q145 520 109 498T49 475Z"></path></g></g><g data-mml-node="mi" transform="translate(545, -150) scale(0.707)"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(6619.2, 0)"><path data-c="222A" d="M591 598H592Q604 598 611 583V376Q611 345 611 296Q610 162 606 148Q605 146 605 145Q586 68 507 23T333 -22Q268 -22 209 -1T106 66T56 173Q55 180 55 384L56 585Q66 598 75 598Q85 598 95 585V378L96 172L98 162Q112 95 181 57T332 18Q415 18 487 58T570 175Q571 180 571 383V583Q579 598 591 598Z"></path></g><g data-mml-node="msub" transform="translate(7508.4, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="54" d="M49 475Q34 475 34 490Q34 552 106 611T261 681Q272 683 507 683H742Q790 717 816 717Q833 717 833 708Q833 682 795 653T714 615Q691 610 588 609Q490 609 490 607L483 580Q476 554 462 496T435 392Q410 289 395 231T363 116T335 34T309 -15T279 -47T242 -64Q231 -68 218 -68Q203 -68 203 -57Q203 -52 211 -38Q224 -7 234 20T251 66T268 123T283 179T304 261T328 360Q342 415 360 488Q380 567 384 582T397 605Q400 607 401 609H302H244Q200 609 188 607T167 596Q145 572 145 541Q145 520 109 498T49 475Z"></path></g></g><g data-mml-node="mi" transform="translate(545, -150) scale(0.707)"><path data-c="68" d="M137 683Q138 683 209 688T282 694Q294 694 294 685Q294 674 258 534Q220 386 220 383Q220 381 227 388Q288 442 357 442Q411 442 444 415T478 336Q478 285 440 178T402 50Q403 36 407 31T422 26Q450 26 474 56T513 138Q516 149 519 151T535 153Q555 153 555 145Q555 144 551 130Q535 71 500 33Q466 -10 419 -10H414Q367 -10 346 17T325 74Q325 90 361 192T398 345Q398 404 354 404H349Q266 404 205 306L198 293L164 158Q132 28 127 16Q114 -11 83 -11Q69 -11 59 -2T48 16Q48 30 121 320L195 616Q195 629 188 632T149 637H128Q122 643 122 645T124 664Q129 683 137 683Z"></path></g></g></g></g><g data-mml-node="mtr" transform="translate(0, -1200)"><g data-mml-node="mtd"><g data-mml-node="mn"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g><g data-mml-node="mo" transform="translate(500, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g><g data-mml-node="mtd" transform="translate(1778, 0)"><g data-mml-node="mtext"><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z"></path><path data-c="74" d="M27 422Q80 426 109 478T141 600V615H181V431H316V385H181V241Q182 116 182 100T189 68Q203 29 238 29Q282 29 292 100Q293 108 293 146V181H333V146V134Q333 57 291 17Q264 -10 221 -10Q187 -10 162 2T124 33T105 68T98 100Q97 107 97 248V385H18V422H27Z" transform="translate(500, 0)"></path><path data-c="68" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 124T102 167T103 217T103 272T103 329Q103 366 103 407T103 482T102 542T102 586T102 603Q99 622 88 628T43 637H25V660Q25 683 27 683L37 684Q47 685 66 686T103 688Q120 689 140 690T170 693T181 694H184V367Q244 442 328 442Q451 442 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(889, 0)"></path><path data-c="65" d="M28 218Q28 273 48 318T98 391T163 433T229 448Q282 448 320 430T378 380T406 316T415 245Q415 238 408 231H126V216Q126 68 226 36Q246 30 270 30Q312 30 342 62Q359 79 369 104L379 128Q382 131 395 131H398Q415 131 415 121Q415 117 412 108Q393 53 349 21T250 -11Q155 -11 92 58T28 218ZM333 275Q322 403 238 411H236Q228 411 220 410T195 402T166 381T143 340T127 274V267H333V275Z" transform="translate(1445, 0)"></path><path data-c="72" d="M36 46H50Q89 46 97 60V68Q97 77 97 91T98 122T98 161T98 203Q98 234 98 269T98 328L97 351Q94 370 83 376T38 385H20V408Q20 431 22 431L32 432Q42 433 60 434T96 436Q112 437 131 438T160 441T171 442H174V373Q213 441 271 441H277Q322 441 343 419T364 373Q364 352 351 337T313 322Q288 322 276 338T263 372Q263 381 265 388T270 400T273 405Q271 407 250 401Q234 393 226 386Q179 341 179 207V154Q179 141 179 127T179 101T180 81T180 66V61Q181 59 183 57T188 54T193 51T200 49T207 48T216 47T225 47T235 46T245 46H276V0H267Q249 3 140 3Q37 3 28 0H20V46H36Z" transform="translate(1889, 0)"></path><path data-c="77" d="M90 368Q84 378 76 380T40 385H18V431H24L43 430Q62 430 84 429T116 428Q206 428 221 431H229V385H215Q177 383 177 368Q177 367 221 239L265 113L339 328L333 345Q323 374 316 379Q308 384 278 385H258V431H264Q270 428 348 428Q439 428 454 431H461V385H452Q404 385 404 369Q404 366 418 324T449 234T481 143L496 100L537 219Q579 341 579 347Q579 363 564 373T530 385H522V431H529Q541 428 624 428Q692 428 698 431H703V385H697Q696 385 691 385T682 384Q635 377 619 334L559 161Q546 124 528 71Q508 12 503 1T487 -11H479Q460 -11 456 -4Q455 -3 407 133L361 267Q359 263 266 -4Q261 -11 243 -11H238Q225 -11 220 -3L90 368Z" transform="translate(2281, 0)"></path><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z" transform="translate(3003, 0)"></path><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z" transform="translate(3281, 0)"></path><path data-c="65" d="M28 218Q28 273 48 318T98 391T163 433T229 448Q282 448 320 430T378 380T406 316T415 245Q415 238 408 231H126V216Q126 68 226 36Q246 30 270 30Q312 30 342 62Q359 79 369 104L379 128Q382 131 395 131H398Q415 131 415 121Q415 117 412 108Q393 53 349 21T250 -11Q155 -11 92 58T28 218ZM333 275Q322 403 238 411H236Q228 411 220 410T195 402T166 381T143 340T127 274V267H333V275Z" transform="translate(3675, 0)"></path></g></g></g></g><g data-mml-node="mo" transform="translate(11177.7, 0)"></g></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中 </span><span style="cursor:pointer;" data-formula="\mathcal{T}_r"><span data-formula="\mathcal{T}_r"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -717 913.9 874.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 2.068ex;height: 1.979ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="54" d="M49 475Q34 475 34 490Q34 552 106 611T261 681Q272 683 507 683H742Q790 717 816 717Q833 717 833 708Q833 682 795 653T714 615Q691 610 588 609Q490 609 490 607L483 580Q476 554 462 496T435 392Q410 289 395 231T363 116T335 34T309 -15T279 -47T242 -64Q231 -68 218 -68Q203 -68 203 -57Q203 -52 211 -38Q224 -7 234 20T251 66T268 123T283 179T304 261T328 360Q342 415 360 488Q380 567 384 582T397 605Q400 607 401 609H302H244Q200 609 188 607T167 596Q145 572 145 541Q145 520 109 498T49 475Z"></path></g></g><g data-mml-node="mi" transform="translate(545, -150) scale(0.707)"><path data-c="72" d="M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 和 </span><span style="cursor:pointer;" data-formula="\mathcal{T}_h"><span data-formula="\mathcal{T}_h"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -717 1002.3 874.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 2.268ex;height: 1.979ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="54" d="M49 475Q34 475 34 490Q34 552 106 611T261 681Q272 683 507 683H742Q790 717 816 717Q833 717 833 708Q833 682 795 653T714 615Q691 610 588 609Q490 609 490 607L483 580Q476 554 462 496T435 392Q410 289 395 231T363 116T335 34T309 -15T279 -47T242 -64Q231 -68 218 -68Q203 -68 203 -57Q203 -52 211 -38Q224 -7 234 20T251 66T268 123T283 179T304 261T328 360Q342 415 360 488Q380 567 384 582T397 605Q400 607 401 609H302H244Q200 609 188 607T167 596Q145 572 145 541Q145 520 109 498T49 475Z"></path></g></g><g data-mml-node="mi" transform="translate(545, -150) scale(0.707)"><path data-c="68" d="M137 683Q138 683 209 688T282 694Q294 694 294 685Q294 674 258 534Q220 386 220 383Q220 381 227 388Q288 442 357 442Q411 442 444 415T478 336Q478 285 440 178T402 50Q403 36 407 31T422 26Q450 26 474 56T513 138Q516 149 519 151T535 153Q555 153 555 145Q555 144 551 130Q535 71 500 33Q466 -10 419 -10H414Q367 -10 346 17T325 74Q325 90 361 192T398 345Q398 404 354 404H349Q266 404 205 306L198 293L164 158Q132 28 127 16Q114 -11 83 -11Q69 -11 59 -2T48 16Q48 30 121 320L195 616Q195 629 188 632T149 637H128Q122 643 122 645T124 664Q129 683 137 683Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 分别代表 RGB 和 HOI 的 Token 集合。这样做的好处在于：</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">在推理阶段，我们可以直接扔掉 HOI 分支，实现零额外开销的生成，但此时的 RGB 骨干网络已经通过共享参数“吸收”了结构流带来的物理约束。</span></strong></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. Human-Aware MoE：给手和脸开个“小灶”</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">手部和脸部是人类视觉最敏感的区域，也是最容易出 Bug 的地方，需要被特别关照。CoInteract 在 DiT 块中嵌入了人体感知 MoE。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">空间监督路由</span></b><span leaf="">：模型利用人脸和手部的边界框（Bbox）作为监督，训练一个轻量级路由器。为了不干扰主干特征学习，路由器输入前会进行梯度截断（Stop-gradient）。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">专项专家</span></b><span leaf="">：路由器会将属于手部的 Token 发送给“手部专家”（Hand Expert），将脸部发送给“头部专家”（Head Expert）。这些专家是专门针对这些高频细节优化的轻量级全连接网络（FFN）。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="CoInteract 整体框架图，展示了双流生成和 MoE 路由的细节" class="rich_pages wxw-img" data-ratio="0.9962962962962963" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175557" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=934422a7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWib2tKAiaKOgVQssGFet9Kaw7bQzk4nE9SAzQsVwLJ5N5CkvJdxu8qJajj1FEZZAl8LxCgzKfRzk1yibg0C4JnQoaI68dic1cJPtlY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">CoInteract 整体框架图，展示了双流生成和 MoE 路由的细节</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 3D RoPE：统一的时空坐标系</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了处理历史运动、参考图、RGB 流和结构流等多种模态，模型使用了 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">3D 旋转位置编码（3D Rotary Positional Encoding, 3D RoPE）</span></strong><span leaf="">。它给每个 Token 分配了独特的 </span><span style="cursor:pointer;" data-formula="(h, w, t)"><span data-formula="(h, w, t)"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 3320.3 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 7.512ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="68" d="M137 683Q138 683 209 688T282 694Q294 694 294 685Q294 674 258 534Q220 386 220 383Q220 381 227 388Q288 442 357 442Q411 442 444 415T478 336Q478 285 440 178T402 50Q403 36 407 31T422 26Q450 26 474 56T513 138Q516 149 519 151T535 153Q555 153 555 145Q555 144 551 130Q535 71 500 33Q466 -10 419 -10H414Q367 -10 346 17T325 74Q325 90 361 192T398 345Q398 404 354 404H349Q266 404 205 306L198 293L164 158Q132 28 127 16Q114 -11 83 -11Q69 -11 59 -2T48 16Q48 30 121 320L195 616Q195 629 188 632T149 637H128Q122 643 122 645T124 664Q129 683 137 683Z"></path></g><g data-mml-node="mo" transform="translate(965, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1409.7, 0)"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="mo" transform="translate(2125.7, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(2570.3, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(2931.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 坐标：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">空间维度</span></b><span leaf="">：RGB 和 HOI 流在宽度维度上进行偏移拼接，共享高度坐标。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">时间维度</span></b><span leaf="">：历史运动帧被分配负的时间索引（如 </span><span style="cursor:pointer;" data-formula="t &lt; 0"><span data-formula="t &lt; 0"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -666 2194.6 706" aria-hidden="true" style="vertical-align: -0.09ex;width: 4.965ex;height: 1.597ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(638.8, 0)"><path data-c="3C" d="M694 -11T694 -19T688 -33T678 -40Q671 -40 524 29T234 166L90 235Q83 240 83 250Q83 261 91 266Q664 540 678 540Q681 540 687 534T694 519T687 505Q686 504 417 376L151 250L417 124Q686 -4 687 -5Q694 -11 694 -19Z"></path></g><g data-mml-node="mn" transform="translate(1694.6, 0)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g><g></g></svg></span></span><span leaf="">），而静态参考图则被映射到远场时间位置（如 </span><span style="cursor:pointer;" data-formula="t=30"><span data-formula="t=30"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -666 2694.6 748" aria-hidden="true" style="vertical-align: -0.186ex;width: 6.096ex;height: 1.692ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(638.8, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(1694.6, 0)"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z" transform="translate(500, 0)"></path></g></g></g><g></g></svg></span></span><span leaf="">），确保模型能分清“因果关系”和“全局身份锚点”。</span></p></li></ul><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">4. 数据预处理：构建“纹理剥离”的结构流</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了训练这个模型，研究团队开发了一套精密的预处理流水线。如下图所示，他们首先利用 Qwen-Edit 对视频进行实体解耦，提取独立的个人和产品参考图。接着，利用 SAM3 获取物体掩码，并结合 SAM3D-body 恢复人体网格（Mesh），将其投影到图像平面。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="预处理流水线，用于构建配对的 RGB 和 HOI 结构训练数据" class="rich_pages wxw-img" data-ratio="0.27685185185185185" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175562" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=5c093066&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibia77QUTWicsErtbiaBSea7jbNvGpHArf9Qj7vMxBOuKiciaOLcwibANT9zqPyCHUw2Z90TKUSEey0yaZLicSiblOBSxteicdUcqSm7Rr4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">预处理流水线，用于构建配对的 RGB 和 HOI 结构训练数据</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种“纹理剥离”的 HOI 结构流迫使模型学习纯粹的几何交互，而不是通过颜色纹理来走捷径。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果：物理一致性的新标杆</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队构建了一个包含 40 小时产品演示视频的数据库，并清洗出 12K 个高质量片段进行训练。在定量评估中，CoInteract 在多个维度刷新了记录。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">特别值得关注的是 </span><font color="#0000FF"><b><span leaf="">VLM-QA</span></b></font><span leaf=""> 指标（利用 Gemini-3-Pro 进行的交互合理性问答）和 </span><font color="#0000FF"><b><span leaf="">HQ</span></b></font><span leaf="">（手部质量，基于 DWPose 的置信度得分）。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">交互合理性</span></b><span leaf="">：CoInteract 达到了 </span><font color="#0000FF"><b><span leaf="">0.72</span></b></font><span leaf="">，远超次优模型 InteractAvatar 的 0.62。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">手部质量</span></b><span leaf="">：得分 </span><font color="#0000FF"><b><span leaf="">0.724</span></b></font><span leaf="">，证明了 MoE 模块在稳定手部结构方面的巨大价值。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="定量对比表，CoInteract 在交互质量和参考一致性上表现卓越" class="rich_pages wxw-img" data-ratio="0.425" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175563" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=ce5ac596&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8ZQt7xfmWsibE7pictahQnFLlK2iaRyUsgOpUdcRmRkdS8QFhQ6tOkJMTOY4QQbFCJ2cPZLg8icqaAN8BQ8dqp9PMIVJ1pmfJK0icw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">定量对比表，CoInteract 在交互质量和参考一致性上表现卓越</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从定性对比图（下图 5）可以看到，其他模型在处理“调整包带”或“拿着毛绒玩具”等动作时，经常会出现手部变形或物体扭曲，而 CoInteract 生成的视频在手部抓握细节和物体稳定性上明显更胜一筹。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="定性对比，CoInteract 在复杂交互场景下的表现更加稳健" class="rich_pages wxw-img" data-ratio="1.0148148148148148" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175565" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=bafac5f6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8eGFU3MhBr4sRtXdLx9uxascppMtzuCuTqficibtSStUq9jWJ8XgvibMJOjdIW42P7xicLuibLCQ6nibnqG9THias1PIy6HbZ3wiaxzLw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">定性对比，CoInteract 在复杂交互场景下的表现更加稳健</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在用户研究中，CoInteract 在物体一致性、人/背景一致性以及最重要的交互合理性上，均获得了最低的平均排名（Mean Rank，越低越好），这进一步证实了其在真实感上的领先地位。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="用户研究结果，CoInteract 在多项主观指标上均排名第一" class="rich_pages wxw-img" data-ratio="0.22037037037037038" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175561" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=f8d015d1&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicqbNPe1peglgw3ia62mMjpUExJBfpu7T7c8tDZ6sPiapXwibmUpyBmFIMB8t99AtWib2CoIDINlbrSwa8iaM1lEp1r676093D5dVGM%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">用户研究结果，CoInteract 在多项主观指标上均排名第一</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">CoInteract 说明了</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">对于复杂的物理交互任务，单纯堆砌像素层面的数据可能还不够，将结构先验和几何约束内化到模型架构中，往往能起到事半功倍的效果。</span></strong></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种“训练时有结构引导，推理时无额外开销”的设计思路，非常适合落地到对实时性和质量都有高要求的场景，比如电商直播、虚拟试穿等。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前该项目推理代码已开源，作者称将会在近期完整开源训练和姿态控制代码，感兴趣的小伙伴可以期待一下。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.125" data-type="gif" data-w="960" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175564" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=dcbcb68c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGWic41icIwejoNUhBUjUm5R9OhqdxqKrIeDqHeQV79UODgwEJpvIyqfGzYjJ4iaE20ibdezksC9xZrQG6ic2y9O3WTTqgFAhYVybtD4U%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-ratio="0.7064814814814815" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175567" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=046bc0f9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9o6k1ibtyBdur8ibUuL3Img0HAc96G2y7BOicSLu2srCPaj9JhLQv2cx46nUgYJvnGegRk0y8RsrZTquibGMiaFAgic4L40RkImCMNk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=3aa6664e&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659257%26idx%3D1%26sn%3D0d1033d4cd6d245a69e334d2f74c72cd">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Wed, 29 Apr 2026 19:54:00 +0800</pubDate>
    </item>
    <item>
      <title>CVPR 2026 | Meta提出GeoRelight：重打光与3D重建的“双向奔赴”，单图生成照片级光影</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659203&amp;idx=1&amp;sn=2a530ea1fa257389335b319727a99fb3</link>
      <description>单图重打光与3D重建的完美协同。</description>
      <content:encoded><![CDATA[<p><span>CV君</span> <span>2026-04-28 23:06</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=7c5e6238&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGWibBQrLBryc6B3pf4Q7OjPUmvrDS4OleIMvSmIXed4mlSNdZAvJGYVzBibrCI71W0bGEMd0088AVYuY9scEIibSD8bUWp7DRzCDV4%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>单图重打光与3D重建的完美协同。</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175531" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2778649921507064" data-w="637" src="https://wechat2rss.xlab.app/img-proxy/?k=9e4a1777&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW8VnX3fzHn7AV3gziaFSF1dtJqfRnGfibJIGAaQ3QhSmzibA068j12sGfjx3giaZke8GTKCgAQ4WSUYvFeFUdmXnrshxv2O4qWQCLA%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">给一张单人照片，如何能让他瞬间“穿越”到不同的光影场景中？这在计算机视觉领域被称为“重打光（Relighting）”。虽然听起来简单，但要把光影做得既真实又符合人物的立体轮廓，其实非常困难。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">最近，来自Meta、图宾根大学和马普信息学研究所的研究团队提出了一项名为 </span><b><span leaf="">GeoRelight</span></b><span leaf=""> 的新技术。其核心思想：重打光和3D几何重建不应该是“各扫门前雪”的两个步骤，而应该“双向奔赴”。此外，为了让3D形状能完美适配扩散模型，作者还设计了一种名为 </span><b><span leaf="">iNOD</span></b><span leaf="">（等轴测归一化正交深度，Isotropic Normalized Orthographic Depth）的新型几何表示法，解决了传统深度图在压缩过程中的畸变问题。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175534" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.29444444444444445" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=956502e0&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9bpp7UrxdwdTvRRaKS7hEic6dRxtJbzn6gGicpjRHVwMRZk8xBVXk7hKUBKPpxeSkzeveOmBWYJKgydCylfZvymDWfadwfX6XYo%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2604.20715" target="_blank">https://arxiv.org/abs/2604.20715</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">项目主页</span></b><span leaf="">: <a href="https://yuxuan-xue.com/georelight/" target="_blank">https://yuxuan-xue.com/georelight/</a></span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">为什么重打光需要“懂”几何？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在过去，很多重打光方法要么是纯粹的“像素翻译”，不考虑几何形状，导致阴影位置不对；要么是“串联式”的，先预测几何，再渲染光影。这种串联方式有个致命伤：</span><b><span leaf="">误差累积</span></b><span leaf="">。第一步如果几何算错了，第二步渲染出的光影就会错得离谱，且无法修正。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">GeoRelight 的研究者们意识到，几何与光影其实是互利的。准确的3D几何能让重打光产生物理一致的阴影；反过来，光影中的明暗变化（即“由明暗求形状”，Shape-from-shading）也能反哺几何模型，让重建出的3D细节更丰富。这种双向的信息流动，正是 </span><b><span leaf="">GeoRelight</span></b><span leaf=""> 能够实现照片级真实感的关键。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="GeoRelight 效果展示：从单图联合生成重打光、反射率、法线和3D点云" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175535" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.6861111111111111" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=273bea82&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicaKCdHSjc47PO2su7PNSpn05vzAVJLrX8uAiaEvlrtSs1sbedoVZ3KJ5SoDB9dErv9nChQrnaaicD7bLe4In9JyeSr0PgIchBcA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">GeoRelight 效果展示：从单图联合生成重打光、反射率、法线和3D点云</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">方法详解：多模态的“分身术”</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">GeoRelight 的核心是一个灵活的多模态扩散 Transformer（Multi-Modal Diffusion Transformer, DiT）。它不再将不同的任务分开处理，而是将它们整合进一个统一的生成框架中。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. “模态即时间”的巧妙架构</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队修改了现有的视频扩散模型架构。原本视频模型处理的是随时间变化的帧（</span><span style="cursor:pointer;" data-formula="T"><span data-formula="T"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -677 704 677" aria-hidden="true" style="vertical-align: 0px;width: 1.593ex;height: 1.532ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="54" d="M40 437Q21 437 21 445Q21 450 37 501T71 602L88 651Q93 669 101 677H569H659Q691 677 697 676T704 667Q704 661 687 553T668 444Q668 437 649 437Q640 437 637 437T631 442L629 445Q629 451 635 490T641 551Q641 586 628 604T573 629Q568 630 515 631Q469 631 457 630T439 622Q438 621 368 343T298 60Q298 48 386 46Q418 46 427 45T436 36Q436 31 433 22Q429 4 424 1L422 0Q419 0 415 0Q410 0 363 1T228 2Q99 2 64 0H49Q43 6 43 9T45 27Q49 40 55 46H83H94Q174 46 189 55Q190 56 191 56Q196 59 201 76T241 233Q258 301 269 344Q339 619 339 625Q339 630 310 630H279Q212 630 191 624Q146 614 121 583T67 467Q60 445 57 441T43 437H40Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 维度），GeoRelight 将其改造成了处理不同的“模态”（</span><span style="cursor:pointer;" data-formula="M"><span data-formula="M"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 1051 683" aria-hidden="true" style="vertical-align: 0px;width: 2.378ex;height: 1.545ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="4D" d="M289 629Q289 635 232 637Q208 637 201 638T194 648Q194 649 196 659Q197 662 198 666T199 671T201 676T203 679T207 681T212 683T220 683T232 684Q238 684 262 684T307 683Q386 683 398 683T414 678Q415 674 451 396L487 117L510 154Q534 190 574 254T662 394Q837 673 839 675Q840 676 842 678T846 681L852 683H948Q965 683 988 683T1017 684Q1051 684 1051 673Q1051 668 1048 656T1045 643Q1041 637 1008 637Q968 636 957 634T939 623Q936 618 867 340T797 59Q797 55 798 54T805 50T822 48T855 46H886Q892 37 892 35Q892 19 885 5Q880 0 869 0Q864 0 828 1T736 2Q675 2 644 2T609 1Q592 1 592 11Q592 13 594 25Q598 41 602 43T625 46Q652 46 685 49Q699 52 704 61Q706 65 742 207T813 490T848 631L654 322Q458 10 453 5Q451 4 449 3Q444 0 433 0Q418 0 415 7Q413 11 374 317L335 624L267 354Q200 88 200 79Q206 46 272 46H282Q288 41 289 37T286 19Q282 3 278 1Q274 0 267 0Q265 0 255 0T221 1T157 2Q127 2 95 1T58 0Q43 0 39 2T35 11Q35 13 38 25T43 40Q45 46 65 46Q135 46 154 86Q158 92 223 354T289 629Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 维度）。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">输入（Input）</span></b><span leaf="">：一张单目人像图片 </span><span style="cursor:pointer;" data-formula="I"><span data-formula="I"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 504 683" aria-hidden="true" style="vertical-align: 0px;width: 1.14ex;height: 1.545ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 和目标环境光图 </span><span style="cursor:pointer;" data-formula="E"><span data-formula="E"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -680 764 680" aria-hidden="true" style="vertical-align: 0px;width: 1.729ex;height: 1.538ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="45" d="M492 213Q472 213 472 226Q472 230 477 250T482 285Q482 316 461 323T364 330H312Q311 328 277 192T243 52Q243 48 254 48T334 46Q428 46 458 48T518 61Q567 77 599 117T670 248Q680 270 683 272Q690 274 698 274Q718 274 718 261Q613 7 608 2Q605 0 322 0H133Q31 0 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H757Q764 676 764 669Q764 664 751 557T737 447Q735 440 717 440H705Q698 445 698 453L701 476Q704 500 704 528Q704 558 697 578T678 609T643 625T596 632T532 634H485Q397 633 392 631Q388 629 386 622Q385 619 355 499T324 377Q347 376 372 376H398Q464 376 489 391T534 472Q538 488 540 490T557 493Q562 493 565 493T570 492T572 491T574 487T577 483L544 351Q511 218 508 216Q505 213 492 213Z"></path></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">输出（Output）</span></b><span leaf="">：模型并行地去噪并生成五种模态——重打光图像 </span><span style="cursor:pointer;" data-formula="\mathbf{z}^{\mathbf{I}_{\mathbf{E}}}"><span data-formula="\mathbf{z}^{\mathbf{I}_{\mathbf{E}}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -848.1 1282.7 848.1" aria-hidden="true" style="vertical-align: 0px;width: 2.902ex;height: 1.919ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="7A" d="M48 262Q48 264 54 349T60 436V444H252Q289 444 336 444T394 445Q441 445 450 441T459 418Q459 406 458 404Q456 399 327 229T194 55H237Q260 56 268 56T297 58T325 65T348 77T370 98T384 128T395 170Q400 197 400 216Q400 217 431 217H462V211Q461 208 453 108T444 6V0H245Q46 0 43 2Q32 7 32 28V33Q32 41 40 52T84 112Q129 170 164 217L298 393H256Q189 392 165 380Q124 360 115 303Q110 280 110 256Q110 254 79 254H48V262Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(511, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="49" d="M397 0Q370 3 218 3Q65 3 38 0H25V62H139V624H25V686H38Q65 683 218 683Q370 683 397 686H410V624H296V62H410V0H397Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(436, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="45" d="M723 286Q721 284 700 145T677 3V0H39V62H147V618H39V680H660V676Q662 670 675 552T691 428V424H629V428Q629 429 627 448T618 494T601 541Q574 593 527 605T382 618H374H304V384H336Q338 384 347 384T361 384T376 386T392 390T407 397T421 407T432 423Q442 444 443 482V501H505V205H443V224Q442 258 435 278T411 307T380 318T336 322H304V62H375H394Q429 62 449 62T497 66T541 76T577 95T609 126T632 170T651 232Q661 287 661 289H723V286Z"></path></g></g></g></g></g></g></g></g><g></g></svg></span></span><span leaf="">、本质反射率（Albedo） </span><span style="cursor:pointer;" data-formula="\mathbf{z}^{\mathbf{a}}"><span data-formula="\mathbf{z}^{\mathbf{a}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683.3 956.3 683.3" aria-hidden="true" style="vertical-align: 0px;width: 2.164ex;height: 1.546ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="7A" d="M48 262Q48 264 54 349T60 436V444H252Q289 444 336 444T394 445Q441 445 450 441T459 418Q459 406 458 404Q456 399 327 229T194 55H237Q260 56 268 56T297 58T325 65T348 77T370 98T384 128T395 170Q400 197 400 216Q400 217 431 217H462V211Q461 208 453 108T444 6V0H245Q46 0 43 2Q32 7 32 28V33Q32 41 40 52T84 112Q129 170 164 217L298 393H256Q189 392 165 380Q124 360 115 303Q110 280 110 256Q110 254 79 254H48V262Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(511, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="61" d="M64 349Q64 399 107 426T255 453Q346 453 402 423T473 341Q478 327 478 310T479 196V77Q493 63 529 62Q549 62 553 57T558 31Q558 9 552 5T514 0H497H481Q375 0 367 56L356 46Q300 -6 210 -6Q130 -6 81 30T32 121Q32 188 111 226T332 272H350V292Q350 313 348 327T337 361T306 391T248 402T194 399H189Q204 376 204 354Q204 327 187 306T134 284Q97 284 81 305T64 349ZM164 121Q164 89 186 67T238 45Q274 45 307 63T346 108L350 117V226H347Q248 218 206 189T164 121Z"></path></g></g></g></g></g></g><g></g></svg></span></span><span leaf="">、表面法线（Normal） </span><span style="cursor:pointer;" data-formula="\mathbf{z}^{\mathbf{n}}"><span data-formula="\mathbf{z}^{\mathbf{n}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -681.2 1012.8 681.2" aria-hidden="true" style="vertical-align: 0px;width: 2.291ex;height: 1.541ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="7A" d="M48 262Q48 264 54 349T60 436V444H252Q289 444 336 444T394 445Q441 445 450 441T459 418Q459 406 458 404Q456 399 327 229T194 55H237Q260 56 268 56T297 58T325 65T348 77T370 98T384 128T395 170Q400 197 400 216Q400 217 431 217H462V211Q461 208 453 108T444 6V0H245Q46 0 43 2Q32 7 32 28V33Q32 41 40 52T84 112Q129 170 164 217L298 393H256Q189 392 165 380Q124 360 115 303Q110 280 110 256Q110 254 79 254H48V262Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(511, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="6E" d="M40 442Q217 450 218 450H224V407L225 365Q233 378 245 391T289 422T362 448Q374 450 398 450Q428 450 448 447T491 434T529 402T551 346Q553 335 554 198V62H623V0H614Q596 3 489 3Q374 3 365 0H356V62H425V194V275Q425 348 416 373T371 399Q326 399 288 370T238 290Q236 281 235 171V62H304V0H295Q277 3 171 3Q64 3 46 0H37V62H106V210V303Q106 353 104 363T91 376Q77 380 50 380H37V442H40Z"></path></g></g></g></g></g></g><g></g></svg></span></span><span leaf="">、分割掩码（Segmentation） </span><span style="cursor:pointer;" data-formula="\mathbf{z}^{\mathbf{s}}"><span data-formula="\mathbf{z}^{\mathbf{s}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683.3 882 683.3" aria-hidden="true" style="vertical-align: 0px;width: 1.996ex;height: 1.546ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="7A" d="M48 262Q48 264 54 349T60 436V444H252Q289 444 336 444T394 445Q441 445 450 441T459 418Q459 406 458 404Q456 399 327 229T194 55H237Q260 56 268 56T297 58T325 65T348 77T370 98T384 128T395 170Q400 197 400 216Q400 217 431 217H462V211Q461 208 453 108T444 6V0H245Q46 0 43 2Q32 7 32 28V33Q32 41 40 52T84 112Q129 170 164 217L298 393H256Q189 392 165 380Q124 360 115 303Q110 280 110 256Q110 254 79 254H48V262Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(511, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="73" d="M38 315Q38 339 45 360T70 404T127 440T223 453Q273 453 320 436L338 445L357 453H366Q380 453 383 447T386 403V387V355Q386 331 383 326T365 321H355H349Q333 321 329 324T324 341Q317 406 224 406H216Q123 406 123 353Q123 334 143 321T188 304T244 294T285 286Q305 281 325 273T373 237T412 172Q414 162 414 142Q414 -6 230 -6Q154 -6 117 22L68 -6H58Q44 -6 41 0T38 42V73Q38 85 38 101T37 122Q37 144 42 148T68 153H75Q87 153 91 151T97 147T103 132Q131 46 220 46H230Q257 46 265 47Q330 58 330 108Q330 127 316 142Q300 156 284 162Q271 168 212 178T122 202Q38 243 38 315Z"></path></g></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 以及 </span><b><span leaf="">iNOD</span></b><span leaf=""> 几何表示 </span><span style="cursor:pointer;" data-formula="\mathbf{z}^{\mathbf{g}}"><span data-formula="\mathbf{z}^{\mathbf{g}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -684.7 967.6 684.7" aria-hidden="true" style="vertical-align: 0px;width: 2.189ex;height: 1.549ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="7A" d="M48 262Q48 264 54 349T60 436V444H252Q289 444 336 444T394 445Q441 445 450 441T459 418Q459 406 458 404Q456 399 327 229T194 55H237Q260 56 268 56T297 58T325 65T348 77T370 98T384 128T395 170Q400 197 400 216Q400 217 431 217H462V211Q461 208 453 108T444 6V0H245Q46 0 43 2Q32 7 32 28V33Q32 41 40 52T84 112Q129 170 164 217L298 393H256Q189 392 165 380Q124 360 115 303Q110 280 110 256Q110 254 79 254H48V262Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(511, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="67" d="M50 300Q50 368 105 409T255 450Q328 450 376 426L388 420Q435 455 489 455Q517 455 533 441T554 414T558 389Q558 367 544 353T508 339Q484 339 471 354T458 387Q458 397 462 400Q464 401 461 400Q459 400 454 399Q429 392 427 390Q454 353 459 328Q461 315 461 300Q461 240 419 202Q364 149 248 149Q185 149 136 172Q129 158 129 148Q129 105 170 93Q176 91 263 91Q273 91 298 91T334 91T366 89T400 85T432 77T466 64Q544 22 544 -69Q544 -114 506 -145Q438 -201 287 -201Q149 -201 90 -161T30 -70Q30 -58 33 -47T42 -27T54 -13T69 -1T82 6T94 12T101 15Q66 57 66 106Q66 151 90 187L97 197L89 204Q50 243 50 300ZM485 403H492Q491 404 488 404L485 403V403ZM255 200Q279 200 295 206T319 219T331 242T335 268T336 300Q336 337 333 352T317 380Q298 399 255 399Q228 399 211 392T187 371T178 345T176 312V300V289Q176 235 194 219Q215 200 255 200ZM287 -150Q357 -150 400 -128T443 -71Q443 -65 442 -61T436 -50T420 -37T389 -27T339 -21L308 -20Q276 -20 253 -20Q190 -20 180 -20T156 -26Q130 -38 130 -69Q130 -105 173 -127T287 -150Z"></path></g></g></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了让模型知道自己在处理哪种数据，作者引入了</span><b><span leaf="">模态类型嵌入</span></b><span leaf="">（Modality Type Embedding, </span><span style="cursor:pointer;" data-formula="\mathbf{c}_{\text{modal}}"><span data-formula="\mathbf{c}_{\text{modal}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -453 2446.9 610.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 5.536ex;height: 1.382ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="63" d="M447 131H458Q478 131 478 117Q478 112 471 95T439 51T377 9Q330 -6 286 -6Q196 -6 135 35Q39 96 39 222Q39 324 101 384Q169 453 286 453Q359 453 411 431T464 353Q464 319 445 302T395 284Q360 284 343 305T325 353Q325 380 338 396H333Q317 398 295 398H292Q280 398 271 397T245 390T218 373T197 338T183 283Q182 275 182 231Q182 199 184 180T193 132T220 85T270 57Q289 50 317 50H326Q385 50 414 115Q419 127 423 129T447 131Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(511, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="6D" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q351 442 364 440T387 434T406 426T421 417T432 406T441 395T448 384T452 374T455 366L457 361L460 365Q463 369 466 373T475 384T488 397T503 410T523 422T546 432T572 439T603 442Q729 442 740 329Q741 322 741 190V104Q741 66 743 59T754 49Q775 46 803 46H819V0H811L788 1Q764 2 737 2T699 3Q596 3 587 0H579V46H595Q656 46 656 62Q657 64 657 200Q656 335 655 343Q649 371 635 385T611 402T585 404Q540 404 506 370Q479 343 472 315T464 232V168V108Q464 78 465 68T468 55T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z" transform="translate(833, 0)"></path><path data-c="64" d="M376 495Q376 511 376 535T377 568Q377 613 367 624T316 637H298V660Q298 683 300 683L310 684Q320 685 339 686T376 688Q393 689 413 690T443 693T454 694H457V390Q457 84 458 81Q461 61 472 55T517 46H535V0Q533 0 459 -5T380 -11H373V44L365 37Q307 -11 235 -11Q158 -11 96 50T34 215Q34 315 97 378T244 442Q319 442 376 393V495ZM373 342Q328 405 260 405Q211 405 173 369Q146 341 139 305T131 211Q131 155 138 120T173 59Q203 26 251 26Q322 26 373 103V342Z" transform="translate(1333, 0)"></path><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z" transform="translate(1889, 0)"></path><path data-c="6C" d="M42 46H56Q95 46 103 60V68Q103 77 103 91T103 124T104 167T104 217T104 272T104 329Q104 366 104 407T104 482T104 542T103 586T103 603Q100 622 89 628T44 637H26V660Q26 683 28 683L38 684Q48 685 67 686T104 688Q121 689 141 690T171 693T182 694H185V379Q185 62 186 60Q190 52 198 49Q219 46 247 46H263V0H255L232 1Q209 2 183 2T145 3T107 3T57 1L34 0H26V46H42Z" transform="translate(2389, 0)"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">）和</span><b><span leaf="">模态切换掩码</span></b><span leaf="">（Modality Switch Mask, </span><span style="cursor:pointer;" data-formula="\mathbf{c}_{\text{switch}}"><span data-formula="\mathbf{c}_{\text{switch}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -453 2528.9 610.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 5.721ex;height: 1.382ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="63" d="M447 131H458Q478 131 478 117Q478 112 471 95T439 51T377 9Q330 -6 286 -6Q196 -6 135 35Q39 96 39 222Q39 324 101 384Q169 453 286 453Q359 453 411 431T464 353Q464 319 445 302T395 284Q360 284 343 305T325 353Q325 380 338 396H333Q317 398 295 398H292Q280 398 271 397T245 390T218 373T197 338T183 283Q182 275 182 231Q182 199 184 180T193 132T220 85T270 57Q289 50 317 50H326Q385 50 414 115Q419 127 423 129T447 131Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(511, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path><path data-c="77" d="M90 368Q84 378 76 380T40 385H18V431H24L43 430Q62 430 84 429T116 428Q206 428 221 431H229V385H215Q177 383 177 368Q177 367 221 239L265 113L339 328L333 345Q323 374 316 379Q308 384 278 385H258V431H264Q270 428 348 428Q439 428 454 431H461V385H452Q404 385 404 369Q404 366 418 324T449 234T481 143L496 100L537 219Q579 341 579 347Q579 363 564 373T530 385H522V431H529Q541 428 624 428Q692 428 698 431H703V385H697Q696 385 691 385T682 384Q635 377 619 334L559 161Q546 124 528 71Q508 12 503 1T487 -11H479Q460 -11 456 -4Q455 -3 407 133L361 267Q359 263 266 -4Q261 -11 243 -11H238Q225 -11 220 -3L90 368Z" transform="translate(394, 0)"></path><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z" transform="translate(1116, 0)"></path><path data-c="74" d="M27 422Q80 426 109 478T141 600V615H181V431H316V385H181V241Q182 116 182 100T189 68Q203 29 238 29Q282 29 292 100Q293 108 293 146V181H333V146V134Q333 57 291 17Q264 -10 221 -10Q187 -10 162 2T124 33T105 68T98 100Q97 107 97 248V385H18V422H27Z" transform="translate(1394, 0)"></path><path data-c="63" d="M370 305T349 305T313 320T297 358Q297 381 312 396Q317 401 317 402T307 404Q281 408 258 408Q209 408 178 376Q131 329 131 219Q131 137 162 90Q203 29 272 29Q313 29 338 55T374 117Q376 125 379 127T395 129H409Q415 123 415 120Q415 116 411 104T395 71T366 33T318 2T249 -11Q163 -11 99 53T34 214Q34 318 99 383T250 448T370 421T404 357Q404 334 387 320Z" transform="translate(1783, 0)"></path><path data-c="68" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 124T102 167T103 217T103 272T103 329Q103 366 103 407T103 482T102 542T102 586T102 603Q99 622 88 628T43 637H25V660Q25 683 27 683L37 684Q47 685 66 686T103 688Q120 689 140 690T170 693T181 694H184V367Q244 442 328 442Q451 442 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(2227, 0)"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">）。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="GeoRelight 流程图：利用 c_switch 信号灵活控制目标模态与条件模态" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175533" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.19722222222222222" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=95c50492&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9g5rYj7IKQJgY0k6NG18tl2ENiadEPo7YksauSlzSnO8QVJgoAFNGCCqJQVR13FdBicft9ZNTtTWdMCnbdhskCMgZCNybb7fjCM%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">GeoRelight 流程图：利用 c_switch 信号灵活控制目标模态与条件模态</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">通过 </span><span style="cursor:pointer;" data-formula="\mathbf{c}_{\text{switch}}"><span data-formula="\mathbf{c}_{\text{switch}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -453 2528.9 610.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 5.721ex;height: 1.382ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="63" d="M447 131H458Q478 131 478 117Q478 112 471 95T439 51T377 9Q330 -6 286 -6Q196 -6 135 35Q39 96 39 222Q39 324 101 384Q169 453 286 453Q359 453 411 431T464 353Q464 319 445 302T395 284Q360 284 343 305T325 353Q325 380 338 396H333Q317 398 295 398H292Q280 398 271 397T245 390T218 373T197 338T183 283Q182 275 182 231Q182 199 184 180T193 132T220 85T270 57Q289 50 317 50H326Q385 50 414 115Q419 127 423 129T447 131Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(511, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path><path data-c="77" d="M90 368Q84 378 76 380T40 385H18V431H24L43 430Q62 430 84 429T116 428Q206 428 221 431H229V385H215Q177 383 177 368Q177 367 221 239L265 113L339 328L333 345Q323 374 316 379Q308 384 278 385H258V431H264Q270 428 348 428Q439 428 454 431H461V385H452Q404 385 404 369Q404 366 418 324T449 234T481 143L496 100L537 219Q579 341 579 347Q579 363 564 373T530 385H522V431H529Q541 428 624 428Q692 428 698 431H703V385H697Q696 385 691 385T682 384Q635 377 619 334L559 161Q546 124 528 71Q508 12 503 1T487 -11H479Q460 -11 456 -4Q455 -3 407 133L361 267Q359 263 266 -4Q261 -11 243 -11H238Q225 -11 220 -3L90 368Z" transform="translate(394, 0)"></path><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z" transform="translate(1116, 0)"></path><path data-c="74" d="M27 422Q80 426 109 478T141 600V615H181V431H316V385H181V241Q182 116 182 100T189 68Q203 29 238 29Q282 29 292 100Q293 108 293 146V181H333V146V134Q333 57 291 17Q264 -10 221 -10Q187 -10 162 2T124 33T105 68T98 100Q97 107 97 248V385H18V422H27Z" transform="translate(1394, 0)"></path><path data-c="63" d="M370 305T349 305T313 320T297 358Q297 381 312 396Q317 401 317 402T307 404Q281 408 258 408Q209 408 178 376Q131 329 131 219Q131 137 162 90Q203 29 272 29Q313 29 338 55T374 117Q376 125 379 127T395 129H409Q415 123 415 120Q415 116 411 104T395 71T366 33T318 2T249 -11Q163 -11 99 53T34 214Q34 318 99 383T250 448T370 421T404 357Q404 334 387 320Z" transform="translate(1783, 0)"></path><path data-c="68" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 124T102 167T103 217T103 272T103 329Q103 366 103 407T103 482T102 542T102 586T102 603Q99 622 88 628T43 637H25V660Q25 683 27 683L37 684Q47 685 66 686T103 688Q120 689 140 690T170 693T181 694H184V367Q244 442 328 442Q451 442 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(2227, 0)"></path></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 掩码，模型在推理时甚至可以根据已有的信息（比如你已经有了一张法线图）来引导其他模态的生成。这种设计让模型在去噪过程中，不同模态之间可以通过自注意力机制进行密集的特征交换。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="模型调节细节：各模态在潜空间中的拼接与条件注入流程" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175532" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.8154981549815498" data-w="813" src="https://wechat2rss.xlab.app/img-proxy/?k=d6eb61ed&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicwQHofS6Lg8oXn7h9d7sIz8oaJgIFKaLBggGibq5jsdW5DL7ufKg1cPyah5KU6nSeib5Jiaic85sbV10hMVNgPXx7nLOr83Wr23QI%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">模型调节细节：各模态在潜空间中的拼接与条件注入流程</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. iNOD：为扩散模型量身定制的3D表示</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这是论文中非常亮眼的一个技术点。目前的扩散模型大多在潜空间（Latent Space）工作，需要通过变分自编码器（Variational Auto-Encoder, VAE）进行压缩。但传统的点图（Point Map）在 VAE 压缩后会产生大量噪声，而标准的深度图在归一化时会产生各向异性畸变，导致3D形状“缩水”或“拉长”。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作者提出的 </span><b><span leaf="">iNOD</span></b><span leaf=""> 采用了</span><b><span leaf="">等轴测归一化</span></b><span leaf="">（Isotropic Normalization）。其算法流程如下：</span></p><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">反投影</span></b><span leaf="">：利用相机内参将深度图转为 3D 点云。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">等轴测缩放</span></b><span leaf="">：找到 3D 形状最长的边，将其等比例缩放到 </span><span style="cursor:pointer;" data-formula="[-1, 1]"><span data-formula="[-1, 1]"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2778.7 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 6.287ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="5B" d="M118 -250V750H255V710H158V-210H255V-250H118Z"></path></g><g data-mml-node="mo" transform="translate(278, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(1056, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(1556, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mn" transform="translate(2000.7, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(2500.7, 0)"><path data-c="5D" d="M22 710V750H159V-250H22V-210H119V710H22Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 范围内，保持长宽高比例不变。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">正交投影</span></b><span leaf="">：将归一化后的 </span><span style="cursor:pointer;" data-formula="z"><span data-formula="z"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 465 453" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.052ex;height: 1.025ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 值投影回 2D 平面。</span></p></li></ol><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="iNOD 算法流程：从深度图到无畸变几何表示的转换逻辑" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175536" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="1.3576642335766422" data-w="822" src="https://wechat2rss.xlab.app/img-proxy/?k=474828ca&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9fzHxtFGXJEvdQYMJwz2Db36wUakNiaks3ej9kG6fwsREI1xlu15kqajLLqfY2994KjMTG80uv4dvgibHCdYXOvOV7iaaKTwfwKA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">iNOD 算法流程：从深度图到无畸变几何表示的转换逻辑</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这样生成的深度图不仅能完美保留3D比例，而且对 VAE 非常友好。作者还对 iNOD 边缘进行了扩张（Dilation），有效消除了 VAE 在处理边界时的伪影。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="iNOD 与传统表示法的对比：iNOD 既无噪声也无畸变" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175537" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.907292954264524" data-w="809" src="https://wechat2rss.xlab.app/img-proxy/?k=7fc0fb5a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicA8TFaTP2ukWfYrG5IU223IYuaI1dns0I9SLhrjOKk6Sd8h8eLSwh0ZI4glMSKTGrXLjK4k1hKeUZibG0VkPic5Diah11vUBE2Ag%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">iNOD 与传统表示法的对比：iNOD 既无噪声也无畸变</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 混合训练策略：合成数据与真实数据的“联姻”</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">高质量的3D人像重打光数据极其稀缺。作者采取了</span><b><span leaf="">策略性混合训练</span></b><span leaf="">（Strategic Mixed-Data Training）：</span></p><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">合成数据（Synth）</span></b><span leaf="">：提供完美的几何、法线和重打光真值，教模型基本的物理规律。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">光场数据（Dome）</span></b><span leaf="">：利用 Light Stage 拍摄的真实人像，提供精确的光源位置。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">自然场景数据（ITW）</span></b><span leaf="">：通过预训练的合成模型对自然图像进行“自动标注（Auto-labeling）”，获取伪标签。</span></p></li></ol><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="混合训练数据来源：合成数据、Light Stage 数据和自然场景数据" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175539" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.4648148148148148" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=bf0215d2&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibKRzFV744Yyic3e8L7mNicgN1dfXZZewubLjfC7DEIh12b7Fa8cxdv0tKjCeq65ibbbBS9ySic52Z3IhHbBFV4l2pe2bKNVfObafs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">混合训练数据来源：合成数据、Light Stage 数据和自然场景数据</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种策略让模型既能从合成数据中学到“物理准确性”，又能从自然数据中学到“照片级真实感”。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果：全方位的 SOTA</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">GeoRelight 在重打光、几何重建和本质图分解三个任务上都展现出了显著优势。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175538" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.20555555555555555" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=7405b514&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibYKZxEicu5qvlYYDWawBickvlFQpX4obG2Dcwo6V7LDVKWREePOjSgpVmEu8KPbPbbBFe9RmyRWTDzVWOFvCBxibEE2sdIXOq11o%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在重打光任务中，GeoRelight 在合成数据集上的 PSNR 达到了 </span><font color="#0000FF"><b><span leaf="">27.22</span></b></font><span leaf="">，远超之前的 SOTA 方法 IC-Light (18.49) 和 NeuralGaffer (18.84)。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="重打光定性对比：GeoRelight 的结果更具物理合理性" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175541" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5648148148148148" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=08511880&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW95CezwQIDkWvPiaLJXFV2Fm9aJS9FnrAic0HE404He509IM6icsJbpib5bWZ02s7ceuLkmIH7MAfOr3s6O2Ly7VCib3maCuSbZqn0A%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">重打光定性对比：GeoRelight 的结果更具物理合理性</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从视觉效果上看，它生成的阴影和高光非常自然，完全没有传统方法常见的色偏或伪影。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175543" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.32" data-w="750" src="https://wechat2rss.xlab.app/img-proxy/?k=c853a779&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8SKbjSOBHEpvuxDibhicgxyvu9S1zWQva1TlLryKbZhKqOhcbnw5n5TCwuicibBtyENCia9oSDo5vQiaoMHoFJcI3M89pLg8Cn87G1c%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在几何重建方面，GeoRelight 甚至击败了专门做几何估计的模型如 VGGT 和 MoGe2。它的倒角距离（Chamfer Distance, CD）指标仅为 </span><font color="#0000FF"><b><span leaf="">0.766</span></b></font><span leaf="">，而 MoGe2 为 3.54。这意味着联合建模确实让几何估计变得更精准了。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="几何重建对比：GeoRelight 能够捕捉到更精细的衣物褶皱和面部细节" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175546" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.4462962962962963" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=0fa9b014&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicppoWaVnjPJo8HHzPwQtAqsZbVBkb7TQcX7vbribAyAYibLIPibp2iaeQtWLofHHibY2iastRvQFgpZF2MYskT8KIZNHkCOZHdhduXk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">几何重建对比：GeoRelight 能够捕捉到更精细的衣物褶皱和面部细节</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">更有趣的是消融实验的结论（见下图）：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">没有几何，重打光会变差</span></b><span leaf="">：模型会失去处理复杂阴影和褶皱的能力。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">有了重打光，几何会变强</span></b><span leaf="">：利用新光照下的阴影线索，模型能补全原本模糊的几何细节，实现“由明暗求形状”。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="消融实验：验证了几何与重打光之间的协同效应" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175545" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.31296296296296294" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=b76d28d7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicvljuMmfEus55Rf3uYkvQY8yNQqQ0rRsia0pRrEj9GqibibZlESicZ9A97Ywt4omiaQiaP2Mh1P3TFPRhVBrJJA3GPuT34ic2YjG3ZpQ%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">消融实验：验证了几何与重打光之间的协同效应</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究还发现，加入自然场景数据（ITW）能有效纠正光场数据带来的“光照偏差”，让生成的画面亮度更均衡。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="自然场景数据的益处：纠正了仅用光场数据训练带来的亮度偏差" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175542" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.32953105196451205" data-w="789" src="https://wechat2rss.xlab.app/img-proxy/?k=31098092&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicI52dV9JJiaTLnib1QQK22WL7OsHY800jFciaQQy5lIbvPicp5wQ7zsoUe9gibYkDEMzgdic03dnYSXfHxGDh4TC8D0LPkWKRK8Kkbw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">自然场景数据的益处：纠正了仅用光场数据训练带来的亮度偏差</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">进阶探索：视频重打光的潜力</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">虽然 GeoRelight 主要是为单图设计的，但由于它底层是视频 DiT 架构，作者在补充材料中展示了其扩展到视频领域的潜力。通过将 2D RoPE 替换为 3D RoPE，模型可以在处理多模态的同时保持时间上的一致性。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前单次推理在 A100 上需要约 35 秒，离实时交互还有一段路要走。这也许是未来的研究方向。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">GeoRelight 的成功再次证明了“联合学习”在处理复杂物理现象时的优越性。它不再把重打光看作简单的图像处理，而是深刻理解了背后的 3D 结构。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种将几何先验融入扩散模型的设计思路，不仅提升了重打光的上限，也为 3D 重建提供了一个全新的视角。它生成的 3D 几何和光影的一致性，为未来的高质量数字人生成、虚拟试衣等场景打下了坚实的基础。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175544" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.125" data-w="960" src="https://wechat2rss.xlab.app/img-proxy/?k=d2cd73de&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGWicnQZqIEqMTGdSC0njkQCmaPtQzOVBicibgU5MfPkZ7E1RJa2ibbesj9MMKvic3vQAt14thlKDpqblERMZmdowvwmAnfNWTOo38icEE%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175547" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7064814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=ea1c9e38&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibS2yuoSNEaGm7bDtnErFKL5fsqpdiaQsbahFqUkG2DVhhA9TMOE9chicOjcIT7licjkdXFM52zkuwmOlpk8vYWbKVMd0KN7sWcE4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=dfd0d52c&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659203%26idx%3D1%26sn%3D2a530ea1fa257389335b319727a99fb3">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Tue, 28 Apr 2026 23:06:00 +0800</pubDate>
    </item>
    <item>
      <title>CVPR 2026 oral | 视觉定位隐私保护新标杆！双收敛线 DCL，有效破解几何恢复攻击</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659178&amp;idx=1&amp;sn=1b08734c5b4fb74721ed5ec62ce82549</link>
      <description>最强大的防御并不一定来自更复杂的模型，而可能来自对基础几何逻辑的深刻洞察</description>
      <content:encoded><![CDATA[<p><span>CV君</span> <span>2026-04-27 22:51</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=bed63c01&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGW9uF5FbcsKExUicUEJl1S1WbdicSrCIBiazIoib02JaZ1iclLzTibVKelbc1bTxEY7z1Oc5elXWEyhGbdbY4kvCfzl6uyBaQC6kLiccD8%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>最强大的防御并不一定来自更复杂的模型，而可能来自对基础几何逻辑的深刻洞察</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175515" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2778649921507064" data-w="637" src="https://wechat2rss.xlab.app/img-proxy/?k=cba8a992&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGWibC4Lk25xx8XdiabhbU9CyU1F80SnpTn6maWXk4EYzC5tndFcnuhb0SibE7B4Bwylca35OlLCA9oW7ZTVSQEpnkf7nh1x9Z33IhM%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">本文介绍一篇相对小众的研究方向的论文，同时也是一篇CVPR 26 的 Oral。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在增强现实（AR）、自动驾驶和机器人导航的背后，视觉定位（Visual Localization, VL）扮演着“眼睛”的角色。为了减轻终端设备的负担，现在的主流方案是将图像或特征点发送到云端服务器进行位姿计算。然而，这也带来了一个细思极恐的问题：如果这些数据在传输中被拦截，攻击者是否能通过这些稀疏的特征点还原出你家里的私人场景？</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">最近，来自韩国汉阳大学的研究团队在隐私保护图像查询（Privacy-Preserving Image Queries, PPIQ）领域取得了重要突破。他们提出了一种名为 </span><b><span leaf="">Dual Convergent Lines (DCL)</span></b><span leaf=""> 的新型几何混淆方法。其核心思想非常精妙：它不再像以前的方法那样随机丢弃信息，而是通过预设的两个“锚点”将关键点位置引向错误的路径。作者巧妙地利用了数学上的病态优化问题，让攻击者的恢复算法要么陷入“原地打转”的平凡解，要么陷入“失之毫厘，谬以千里”的不稳定解，从而在保证定位精度的同时，彻底封死了图像反演攻击的后路。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175513" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.19814814814814816" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=d3fd7e2b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibnnDhCA8jicMxxEyUZhPARGlHLaeFMJib47mET1VicWSly4LXnUvwQicFcuTasXvUMOlibx87MJRU8icKPu03FK8xzE6FbkRezMLZ6E%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2604.22310" target="_blank">https://arxiv.org/abs/2604.22310</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">录用会议</span></b><span leaf="">: CVPR 2026 oral</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">背景与动机：脆弱的“随机直线”</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了保护隐私，最经典的做法是“随机直线混淆（Random Lines）”。简单来说，就是不发送关键点的具体坐标 </span><span style="cursor:pointer;" data-formula="(x, y)"><span data-formula="(x, y)"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2284.7 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 5.169ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(961, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1405.7, 0)"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1895.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></span></span><span leaf="">，而是发送一条经过该点的随机方向直线。服务器利用这些直线与 3D 地图进行匹配，依然能算出相机</span><b><span leaf="">六自由度（6-Degrees of Freedom, 6-DoF）</span></b><span leaf="">位姿。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">听起来很完美，对吧？但 Chelani 等人在近期的研究中给这个方案泼了一盆冷水。攻击者发现，虽然单条直线是混淆的，但如果你看一群邻近的直线，它们的交点往往就是原始关键点的位置。通过一种“几何恢复攻击”，攻击者可以轻松找回这些丢失的坐标，进而通过反演网络重建出高清的 RGB 图像。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图1展示了现有方案在面对攻击时的脆弱性，以及 DCL 的鲁棒性" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175514" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="1.1218335343787695" data-w="829" src="https://wechat2rss.xlab.app/img-proxy/?k=09e752a7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicA3pPYZwia3ibKHWO9svQWWHLUriaHKibE7iazqFzKDEMzPfza1sMhgZumMERx6kVSLvM1dparBPwib1g2puQDwOWomKp9Sd2cEWjrM%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图1展示了现有方案在面对攻击时的脆弱性，以及 DCL 的鲁棒性</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">如上图所示，传统的随机直线方案在攻击下几乎“原形毕露”，而 DCL 处理后的结果则让攻击者无从下手。目前市面上的隐私保护方案各有优劣，如下表所示，DCL 在隐私鲁棒性、地图维护成本和实时性之间找到了更优的平衡点。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="Table 1 对比了不同隐私保护范式的优缺点" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175512" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.6654275092936803" data-w="807" src="https://wechat2rss.xlab.app/img-proxy/?k=c5bb055c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWiciatd9cBC5pwu0lTOkbd51ibibgZ7aZibZBJma03gsibH48Rosf2Y0wRI9GXelMzbf3P5wgFEg2Sp87d86jEDttRs4X20RFkPCdAyY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">Table 1 对比了不同隐私保护范式的优缺点</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">方法详解：DCL 的“移魂大法”</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">汉阳大学的研究者们意识到，要真正保护隐私，不能靠随机，而要靠“误导”。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 构造流程：空间分割与锚点锁定</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">DCL 的构造过程（算法输入为原始关键点，输出为混淆后的直线）：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">空间划分</span></b><span leaf="">：首先将图像沿中线垂直分为左右两个区域 </span><span style="cursor:pointer;" data-formula="\mathcal{R}_1"><span data-formula="\mathcal{R}_1"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -682 1251.6 832" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.832ex;height: 1.882ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="52" d="M37 475Q19 475 19 487Q19 503 35 530T83 589T180 647T327 682H374Q387 682 417 682T464 683Q519 683 559 679T642 663T708 625T731 557Q731 481 668 411T504 300Q506 296 512 286T528 257T553 202Q594 105 611 82Q635 47 665 47Q708 47 742 93Q758 113 786 128Q804 136 819 137Q837 137 837 125Q837 115 818 92T767 43T687 -2T589 -22Q549 -22 517 22T467 120T422 221T362 273Q346 273 346 287Q348 301 373 320T436 342Q437 342 446 343T462 345T481 348T504 353T527 362T553 375T577 393Q598 412 614 443T630 511Q630 545 613 566T541 600T393 614Q370 614 370 613L366 584Q349 446 311 307T243 96L213 25Q205 8 179 -7T132 -22Q125 -22 120 -18T117 -8Q117 -5 130 26T163 113T205 239T246 408T274 606V614Q273 614 259 613T231 609T198 602T163 588Q131 572 113 518Q102 502 80 490T37 475Z"></path></g></g><g data-mml-node="mn" transform="translate(848, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 和 </span><span style="cursor:pointer;" data-formula="\mathcal{R}_2"><span data-formula="\mathcal{R}_2"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -682 1251.6 832" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.832ex;height: 1.882ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="52" d="M37 475Q19 475 19 487Q19 503 35 530T83 589T180 647T327 682H374Q387 682 417 682T464 683Q519 683 559 679T642 663T708 625T731 557Q731 481 668 411T504 300Q506 296 512 286T528 257T553 202Q594 105 611 82Q635 47 665 47Q708 47 742 93Q758 113 786 128Q804 136 819 137Q837 137 837 125Q837 115 818 92T767 43T687 -2T589 -22Q549 -22 517 22T467 120T422 221T362 273Q346 273 346 287Q348 301 373 320T436 342Q437 342 446 343T462 345T481 348T504 353T527 362T553 375T577 393Q598 412 614 443T630 511Q630 545 613 566T541 600T393 614Q370 614 370 613L366 584Q349 446 311 307T243 96L213 25Q205 8 179 -7T132 -22Q125 -22 120 -18T117 -8Q117 -5 130 26T163 113T205 239T246 408T274 606V614Q273 614 259 613T231 609T198 602T163 588Q131 572 113 518Q102 502 80 490T37 475Z"></path></g></g><g data-mml-node="mn" transform="translate(848, -150) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">锚点设置</span></b><span leaf="">：在图像中线的顶部和底部分别设置两个固定锚点 </span><span style="cursor:pointer;" data-formula="\mathbf{a}_1 = (W/2, 0)"><span data-formula="\mathbf{a}_1 = (W/2, 0)"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 6066.8 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 13.726ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="61" d="M64 349Q64 399 107 426T255 453Q346 453 402 423T473 341Q478 327 478 310T479 196V77Q493 63 529 62Q549 62 553 57T558 31Q558 9 552 5T514 0H497H481Q375 0 367 56L356 46Q300 -6 210 -6Q130 -6 81 30T32 121Q32 188 111 226T332 272H350V292Q350 313 348 327T337 361T306 391T248 402T194 399H189Q204 376 204 354Q204 327 187 306T134 284Q97 284 81 305T64 349ZM164 121Q164 89 186 67T238 45Q274 45 307 63T346 108L350 117V226H347Q248 218 206 189T164 121Z"></path></g></g><g data-mml-node="mn" transform="translate(559, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="mo" transform="translate(1240.3, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(2296.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(2685.1, 0)"><path data-c="57" d="M436 683Q450 683 486 682T553 680Q604 680 638 681T677 682Q695 682 695 674Q695 670 692 659Q687 641 683 639T661 637Q636 636 621 632T600 624T597 615Q597 603 613 377T629 138L631 141Q633 144 637 151T649 170T666 200T690 241T720 295T759 362Q863 546 877 572T892 604Q892 619 873 628T831 637Q817 637 817 647Q817 650 819 660Q823 676 825 679T839 682Q842 682 856 682T895 682T949 681Q1015 681 1034 683Q1048 683 1048 672Q1048 666 1045 655T1038 640T1028 637Q1006 637 988 631T958 617T939 600T927 584L923 578L754 282Q586 -14 585 -15Q579 -22 561 -22Q546 -22 542 -17Q539 -14 523 229T506 480L494 462Q472 425 366 239Q222 -13 220 -15T215 -19Q210 -22 197 -22Q178 -22 176 -15Q176 -12 154 304T131 622Q129 631 121 633T82 637H58Q51 644 51 648Q52 671 64 683H76Q118 680 176 680Q301 680 313 683H323Q329 677 329 674T327 656Q322 641 318 637H297Q236 634 232 620Q262 160 266 136L501 550L499 587Q496 629 489 632Q483 636 447 637Q428 637 422 639T416 648Q416 650 418 660Q419 664 420 669T421 676T424 680T428 682T436 683Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3733.1, 0)"><g data-mml-node="mo"><path data-c="2F" d="M423 750Q432 750 438 744T444 730Q444 725 271 248T92 -240Q85 -250 75 -250Q68 -250 62 -245T56 -231Q56 -221 230 257T407 740Q411 750 423 750Z"></path></g></g><g data-mml-node="mn" transform="translate(4233.1, 0)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="mo" transform="translate(4733.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mn" transform="translate(5177.8, 0)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g><g data-mml-node="mo" transform="translate(5677.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 和 </span><span style="cursor:pointer;" data-formula="\mathbf{a}_2 = (W/2, H)"><span data-formula="\mathbf{a}_2 = (W/2, H)"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 6454.8 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 14.604ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="61" d="M64 349Q64 399 107 426T255 453Q346 453 402 423T473 341Q478 327 478 310T479 196V77Q493 63 529 62Q549 62 553 57T558 31Q558 9 552 5T514 0H497H481Q375 0 367 56L356 46Q300 -6 210 -6Q130 -6 81 30T32 121Q32 188 111 226T332 272H350V292Q350 313 348 327T337 361T306 391T248 402T194 399H189Q204 376 204 354Q204 327 187 306T134 284Q97 284 81 305T64 349ZM164 121Q164 89 186 67T238 45Q274 45 307 63T346 108L350 117V226H347Q248 218 206 189T164 121Z"></path></g></g><g data-mml-node="mn" transform="translate(559, -150) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="mo" transform="translate(1240.3, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(2296.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(2685.1, 0)"><path data-c="57" d="M436 683Q450 683 486 682T553 680Q604 680 638 681T677 682Q695 682 695 674Q695 670 692 659Q687 641 683 639T661 637Q636 636 621 632T600 624T597 615Q597 603 613 377T629 138L631 141Q633 144 637 151T649 170T666 200T690 241T720 295T759 362Q863 546 877 572T892 604Q892 619 873 628T831 637Q817 637 817 647Q817 650 819 660Q823 676 825 679T839 682Q842 682 856 682T895 682T949 681Q1015 681 1034 683Q1048 683 1048 672Q1048 666 1045 655T1038 640T1028 637Q1006 637 988 631T958 617T939 600T927 584L923 578L754 282Q586 -14 585 -15Q579 -22 561 -22Q546 -22 542 -17Q539 -14 523 229T506 480L494 462Q472 425 366 239Q222 -13 220 -15T215 -19Q210 -22 197 -22Q178 -22 176 -15Q176 -12 154 304T131 622Q129 631 121 633T82 637H58Q51 644 51 648Q52 671 64 683H76Q118 680 176 680Q301 680 313 683H323Q329 677 329 674T327 656Q322 641 318 637H297Q236 634 232 620Q262 160 266 136L501 550L499 587Q496 629 489 632Q483 636 447 637Q428 637 422 639T416 648Q416 650 418 660Q419 664 420 669T421 676T424 680T428 682T436 683Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(3733.1, 0)"><g data-mml-node="mo"><path data-c="2F" d="M423 750Q432 750 438 744T444 730Q444 725 271 248T92 -240Q85 -250 75 -250Q68 -250 62 -245T56 -231Q56 -221 230 257T407 740Q411 750 423 750Z"></path></g></g><g data-mml-node="mn" transform="translate(4233.1, 0)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><g data-mml-node="mo" transform="translate(4733.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(5177.8, 0)"><path data-c="48" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 219 683Q260 681 355 681Q389 681 418 681T463 682T483 682Q499 682 499 672Q499 670 497 658Q492 641 487 638H485Q483 638 480 638T473 638T464 637T455 637Q416 636 405 634T387 623Q384 619 355 500Q348 474 340 442T328 395L324 380Q324 378 469 378H614L615 381Q615 384 646 504Q674 619 674 627T617 637Q594 637 587 639T580 648Q580 650 582 660Q586 677 588 679T604 682Q609 682 646 681T740 680Q802 680 835 681T871 682Q888 682 888 672Q888 645 876 638H874Q872 638 869 638T862 638T853 637T844 637Q805 636 794 634T776 623Q773 618 704 340T634 58Q634 51 638 51Q646 48 692 46H723Q729 38 729 37T726 19Q722 6 716 0H701Q664 2 567 2Q533 2 504 2T458 2T437 1Q420 1 420 10Q420 15 423 24Q428 43 433 45Q437 46 448 46H454Q481 46 514 49Q520 50 522 50T528 55T534 64T540 82T547 110T558 153Q565 181 569 198Q602 330 602 331T457 332H312L279 197Q245 63 245 58Q245 51 253 49T303 46H334Q340 38 340 37T337 19Q333 6 327 0H312Q275 2 178 2Q144 2 115 2T69 2T48 1Q31 1 31 10Q31 12 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g><g data-mml-node="mo" transform="translate(6065.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">直线提升（Line Lifting）</span></b><span leaf="">：对于左侧区域 </span><span style="cursor:pointer;" data-formula="\mathcal{R}_1"><span data-formula="\mathcal{R}_1"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -682 1251.6 832" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.832ex;height: 1.882ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="52" d="M37 475Q19 475 19 487Q19 503 35 530T83 589T180 647T327 682H374Q387 682 417 682T464 683Q519 683 559 679T642 663T708 625T731 557Q731 481 668 411T504 300Q506 296 512 286T528 257T553 202Q594 105 611 82Q635 47 665 47Q708 47 742 93Q758 113 786 128Q804 136 819 137Q837 137 837 125Q837 115 818 92T767 43T687 -2T589 -22Q549 -22 517 22T467 120T422 221T362 273Q346 273 346 287Q348 301 373 320T436 342Q437 342 446 343T462 345T481 348T504 353T527 362T553 375T577 393Q598 412 614 443T630 511Q630 545 613 566T541 600T393 614Q370 614 370 613L366 584Q349 446 311 307T243 96L213 25Q205 8 179 -7T132 -22Q125 -22 120 -18T117 -8Q117 -5 130 26T163 113T205 239T246 408T274 606V614Q273 614 259 613T231 609T198 602T163 588Q131 572 113 518Q102 502 80 490T37 475Z"></path></g></g><g data-mml-node="mn" transform="translate(848, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 的关键点 </span><span style="cursor:pointer;" data-formula="\mathbf{x}_i"><span data-formula="\mathbf{x}_i"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -444 901 601.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 2.038ex;height: 1.361ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g><g data-mml-node="mi" transform="translate(607, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">，将其与顶部锚点 </span><span style="cursor:pointer;" data-formula="\mathbf{a}_1"><span data-formula="\mathbf{a}_1"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -453 962.6 603" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.178ex;height: 1.364ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="61" d="M64 349Q64 399 107 426T255 453Q346 453 402 423T473 341Q478 327 478 310T479 196V77Q493 63 529 62Q549 62 553 57T558 31Q558 9 552 5T514 0H497H481Q375 0 367 56L356 46Q300 -6 210 -6Q130 -6 81 30T32 121Q32 188 111 226T332 272H350V292Q350 313 348 327T337 361T306 391T248 402T194 399H189Q204 376 204 354Q204 327 187 306T134 284Q97 284 81 305T64 349ZM164 121Q164 89 186 67T238 45Q274 45 307 63T346 108L350 117V226H347Q248 218 206 189T164 121Z"></path></g></g><g data-mml-node="mn" transform="translate(559, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 连线；对于右侧区域 </span><span style="cursor:pointer;" data-formula="\mathcal{R}_2"><span data-formula="\mathcal{R}_2"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -682 1251.6 832" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.832ex;height: 1.882ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="52" d="M37 475Q19 475 19 487Q19 503 35 530T83 589T180 647T327 682H374Q387 682 417 682T464 683Q519 683 559 679T642 663T708 625T731 557Q731 481 668 411T504 300Q506 296 512 286T528 257T553 202Q594 105 611 82Q635 47 665 47Q708 47 742 93Q758 113 786 128Q804 136 819 137Q837 137 837 125Q837 115 818 92T767 43T687 -2T589 -22Q549 -22 517 22T467 120T422 221T362 273Q346 273 346 287Q348 301 373 320T436 342Q437 342 446 343T462 345T481 348T504 353T527 362T553 375T577 393Q598 412 614 443T630 511Q630 545 613 566T541 600T393 614Q370 614 370 613L366 584Q349 446 311 307T243 96L213 25Q205 8 179 -7T132 -22Q125 -22 120 -18T117 -8Q117 -5 130 26T163 113T205 239T246 408T274 606V614Q273 614 259 613T231 609T198 602T163 588Q131 572 113 518Q102 502 80 490T37 475Z"></path></g></g><g data-mml-node="mn" transform="translate(848, -150) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 的关键点，则与底部锚点 </span><span style="cursor:pointer;" data-formula="\mathbf{a}_2"><span data-formula="\mathbf{a}_2"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -453 962.6 603" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.178ex;height: 1.364ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="61" d="M64 349Q64 399 107 426T255 453Q346 453 402 423T473 341Q478 327 478 310T479 196V77Q493 63 529 62Q549 62 553 57T558 31Q558 9 552 5T514 0H497H481Q375 0 367 56L356 46Q300 -6 210 -6Q130 -6 81 30T32 121Q32 188 111 226T332 272H350V292Q350 313 348 327T337 361T306 391T248 402T194 399H189Q204 376 204 354Q204 327 187 306T134 284Q97 284 81 305T64 349ZM164 121Q164 89 186 67T238 45Q274 45 307 63T346 108L350 117V226H347Q248 218 206 189T164 121Z"></path></g></g><g data-mml-node="mn" transform="translate(559, -150) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 连线。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">移除原始点</span></b><span leaf="">：最后只发送这些直线方程和对应的描述子，原始坐标被彻底抹除。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图2详细展示了 DCL 的构造步骤：提取、连线、移除" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175516" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.32037037037037036" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=e31333c5&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicXeB2MWK0uoIkOPcZVmKW6kCt7r3L5v1Nx3NYWWSLTkXn7oC8o5Nv5pWrCsEw1fhUo55EOlYGkiaOMw0gIicwLLSfrhk5BmTR7Y%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图2详细展示了 DCL 的构造步骤：提取、连线、移除</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 为什么攻击者会“抓狂”？</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">DCL 专门设计了两种失效模式来对抗几何恢复攻击。攻击者的核心目标是寻找一个点 </span><span style="cursor:pointer;" data-formula="\mathbf{x}_i^*"><span data-formula="\mathbf{x}_i^*"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -691.8 1010.6 959.2" aria-hidden="true" style="vertical-align: -0.605ex;width: 2.286ex;height: 2.17ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g><g data-mml-node="mo" transform="translate(607, 363) scale(0.707)"><path data-c="2217" d="M229 286Q216 420 216 436Q216 454 240 464Q241 464 245 464T251 465Q263 464 273 456T283 436Q283 419 277 356T270 286L328 328Q384 369 389 372T399 375Q412 375 423 365T435 338Q435 325 425 315Q420 312 357 282T289 250L355 219L425 184Q434 175 434 161Q434 146 425 136T401 125Q393 125 383 131T328 171L270 213Q283 79 283 63Q283 53 276 44T250 35Q231 35 224 44T216 63Q216 80 222 143T229 213L171 171Q115 130 110 127Q106 124 100 124Q87 124 76 134T64 161Q64 166 64 169T67 175T72 181T81 188T94 195T113 204T138 215T170 230T210 250L74 315Q65 324 65 338Q65 353 74 363T98 374Q106 374 116 368T171 328L229 286Z"></path></g><g data-mml-node="mi" transform="translate(607, -259.6) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">，使其到邻域内所有混淆直线 </span><span style="cursor:pointer;" data-formula="\{\mathbf{l}_j\}"><span data-formula="\{\mathbf{l}_j\}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 1660.3 1044.2" aria-hidden="true" style="vertical-align: -0.666ex;width: 3.756ex;height: 2.363ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="7B" d="M434 -231Q434 -244 428 -250H410Q281 -250 230 -184Q225 -177 222 -172T217 -161T213 -148T211 -133T210 -111T209 -84T209 -47T209 0Q209 21 209 53Q208 142 204 153Q203 154 203 155Q189 191 153 211T82 231Q71 231 68 234T65 250T68 266T82 269Q116 269 152 289T203 345Q208 356 208 377T209 529V579Q209 634 215 656T244 698Q270 724 324 740Q361 748 377 749Q379 749 390 749T408 750H428Q434 744 434 732Q434 719 431 716Q429 713 415 713Q362 710 332 689T296 647Q291 634 291 499V417Q291 370 288 353T271 314Q240 271 184 255L170 250L184 245Q202 239 220 230T262 196T290 137Q291 131 291 1Q291 -134 296 -147Q306 -174 339 -192T415 -213Q429 -213 431 -216Q434 -219 434 -231Z"></path></g><g data-mml-node="msub" transform="translate(500, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="6C" d="M43 686L134 690Q225 694 226 694H232V62H301V0H292Q274 3 170 3Q67 3 49 0H40V62H109V332Q109 387 109 453T110 534Q110 593 108 605T94 620Q80 624 53 624H40V686H43Z"></path></g></g><g data-mml-node="mi" transform="translate(319, -150) scale(0.707)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g><g data-mml-node="mo" transform="translate(1160.3, 0)"><path data-c="7D" d="M65 731Q65 745 68 747T88 750Q171 750 216 725T279 670Q288 649 289 635T291 501Q292 362 293 357Q306 312 345 291T417 269Q428 269 431 266T434 250T431 234T417 231Q380 231 345 210T298 157Q293 143 292 121T291 -28V-79Q291 -134 285 -156T256 -198Q202 -250 89 -250Q71 -250 68 -247T65 -230Q65 -224 65 -223T66 -218T69 -214T77 -213Q91 -213 108 -210T146 -200T183 -177T207 -139Q208 -134 209 3L210 139Q223 196 280 230Q315 247 330 250Q305 257 280 270Q225 304 212 352L210 362L209 498Q208 635 207 640Q195 680 154 696T77 713Q68 713 67 716T65 731Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 的距离平方和最小。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">模式 1：锚点内收敛（Intra-anchor convergence）</span></b><span leaf="">：如果一个关键点周围的邻居都在同一个区域，那么所有直线都交于同一个锚点。优化算法会发现，在锚点处的代价函数为 0。于是，算法会给出一个“平凡解”——认为关键点就在锚点上（如图 3c）。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">模式 2：锚点间不稳定性（Inter-anchor instability）</span></b><span leaf="">：如果关键点在边界附近，它的邻居可能跨越了中线。这时，来自两个不同锚点的直线在中线附近几乎是平行的。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作者在论文中给出了严谨的数学证明。恢复点的参数 </span><span style="cursor:pointer;" data-formula="t_i^*"><span data-formula="t_i^*"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -691.8 764.6 959.2" aria-hidden="true" style="vertical-align: -0.605ex;width: 1.73ex;height: 2.17ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 363) scale(0.707)"><path data-c="2217" d="M229 286Q216 420 216 436Q216 454 240 464Q241 464 245 464T251 465Q263 464 273 456T283 436Q283 419 277 356T270 286L328 328Q384 369 389 372T399 375Q412 375 423 365T435 338Q435 325 425 315Q420 312 357 282T289 250L355 219L425 184Q434 175 434 161Q434 146 425 136T401 125Q393 125 383 131T328 171L270 213Q283 79 283 63Q283 53 276 44T250 35Q231 35 224 44T216 63Q216 80 222 143T229 213L171 171Q115 130 110 127Q106 124 100 124Q87 124 76 134T64 161Q64 166 64 169T67 175T72 181T81 188T94 195T113 204T138 215T170 230T210 250L74 315Q65 324 65 338Q65 353 74 363T98 374Q106 374 116 368T171 328L229 286Z"></path></g><g data-mml-node="mi" transform="translate(361, -259.6) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 实际上是邻域交点参数 </span><span style="cursor:pointer;" data-formula="\{t_{i,j}^*\}"><span data-formula="\{t_{i,j}^*\}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2142.9 1153.9" aria-hidden="true" style="vertical-align: -0.914ex;width: 4.848ex;height: 2.611ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mo"><path data-c="7B" d="M434 -231Q434 -244 428 -250H410Q281 -250 230 -184Q225 -177 222 -172T217 -161T213 -148T211 -133T210 -111T209 -84T209 -47T209 0Q209 21 209 53Q208 142 204 153Q203 154 203 155Q189 191 153 211T82 231Q71 231 68 234T65 250T68 266T82 269Q116 269 152 289T203 345Q208 356 208 377T209 529V579Q209 634 215 656T244 698Q270 724 324 740Q361 748 377 749Q379 749 390 749T408 750H428Q434 744 434 732Q434 719 431 716Q429 713 415 713Q362 710 332 689T296 647Q291 634 291 499V417Q291 370 288 353T271 314Q240 271 184 255L170 250L184 245Q202 239 220 230T262 196T290 137Q291 131 291 1Q291 -134 296 -147Q306 -174 339 -192T415 -213Q429 -213 431 -216Q434 -219 434 -231Z"></path></g><g data-mml-node="msubsup" transform="translate(500, 0)"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 363) scale(0.707)"><path data-c="2217" d="M229 286Q216 420 216 436Q216 454 240 464Q241 464 245 464T251 465Q263 464 273 456T283 436Q283 419 277 356T270 286L328 328Q384 369 389 372T399 375Q412 375 423 365T435 338Q435 325 425 315Q420 312 357 282T289 250L355 219L425 184Q434 175 434 161Q434 146 425 136T401 125Q393 125 383 131T328 171L270 213Q283 79 283 63Q283 53 276 44T250 35Q231 35 224 44T216 63Q216 80 222 143T229 213L171 171Q115 130 110 127Q106 124 100 124Q87 124 76 134T64 161Q64 166 64 169T67 175T72 181T81 188T94 195T113 204T138 215T170 230T210 250L74 315Q65 324 65 338Q65 353 74 363T98 374Q106 374 116 368T171 328L229 286Z"></path></g><g data-mml-node="TeXAtom" transform="translate(361, -259.6) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g></g><g data-mml-node="mo" transform="translate(1642.9, 0)"><path data-c="7D" d="M65 731Q65 745 68 747T88 750Q171 750 216 725T279 670Q288 649 289 635T291 501Q292 362 293 357Q306 312 345 291T417 269Q428 269 431 266T434 250T431 234T417 231Q380 231 345 210T298 157Q293 143 292 121T291 -28V-79Q291 -134 285 -156T256 -198Q202 -250 89 -250Q71 -250 68 -247T65 -230Q65 -224 65 -223T66 -218T69 -214T77 -213Q91 -213 108 -210T146 -200T183 -177T207 -139Q208 -134 209 3L210 139Q223 196 280 230Q315 247 330 250Q305 257 280 270Q225 304 212 352L210 362L209 498Q208 635 207 640Q195 680 154 696T77 713Q68 713 67 716T65 731Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 的加权平均：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="t_i^* = \frac{\sum_j (w_{i,j} t_{i,j}^*)}{\sum_j w_{i,j}}
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1639.6 7354.1 2779.2" aria-hidden="true" style="max-width: 300%;vertical-align: -2.578ex;width: 16.638ex;height: 6.288ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 413) scale(0.707)"><path data-c="2217" d="M229 286Q216 420 216 436Q216 454 240 464Q241 464 245 464T251 465Q263 464 273 456T283 436Q283 419 277 356T270 286L328 328Q384 369 389 372T399 375Q412 375 423 365T435 338Q435 325 425 315Q420 312 357 282T289 250L355 219L425 184Q434 175 434 161Q434 146 425 136T401 125Q393 125 383 131T328 171L270 213Q283 79 283 63Q283 53 276 44T250 35Q231 35 224 44T216 63Q216 80 222 143T229 213L171 171Q115 130 110 127Q106 124 100 124Q87 124 76 134T64 161Q64 166 64 169T67 175T72 181T81 188T94 195T113 204T138 215T170 230T210 250L74 315Q65 324 65 338Q65 353 74 363T98 374Q106 374 116 368T171 328L229 286Z"></path></g><g data-mml-node="mi" transform="translate(361, -247) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(1042.3, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mfrac" transform="translate(2098.1, 0)"><g data-mml-node="mrow" transform="translate(220, 889.6)"><g data-mml-node="munder"><g data-mml-node="mo"><path data-c="2211" d="M61 748Q64 750 489 750H913L954 640Q965 609 976 579T993 533T999 516H979L959 517Q936 579 886 621T777 682Q724 700 655 705T436 710H319Q183 710 183 709Q186 706 348 484T511 259Q517 250 513 244L490 216Q466 188 420 134T330 27L149 -187Q149 -188 362 -188Q388 -188 436 -188T506 -189Q679 -189 778 -162T936 -43Q946 -27 959 6H999L913 -249L489 -250Q65 -250 62 -248Q56 -246 56 -239Q56 -234 118 -161Q186 -81 245 -11L428 206Q428 207 242 462L57 717L56 728Q56 744 61 748Z"></path></g><g data-mml-node="mi" transform="translate(1056, -285.4) scale(0.707)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g><g data-mml-node="mo" transform="translate(1397.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(1786.3, 0)"><g data-mml-node="mi"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(716, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g></g><g data-mml-node="msubsup" transform="translate(3284.2, 0)"><g data-mml-node="mi"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g><g data-mml-node="mo" transform="translate(361, 363) scale(0.707)"><path data-c="2217" d="M229 286Q216 420 216 436Q216 454 240 464Q241 464 245 464T251 465Q263 464 273 456T283 436Q283 419 277 356T270 286L328 328Q384 369 389 372T399 375Q412 375 423 365T435 338Q435 325 425 315Q420 312 357 282T289 250L355 219L425 184Q434 175 434 161Q434 146 425 136T401 125Q393 125 383 131T328 171L270 213Q283 79 283 63Q283 53 276 44T250 35Q231 35 224 44T216 63Q216 80 222 143T229 213L171 171Q115 130 110 127Q106 124 100 124Q87 124 76 134T64 161Q64 166 64 169T67 175T72 181T81 188T94 195T113 204T138 215T170 230T210 250L74 315Q65 324 65 338Q65 353 74 363T98 374Q106 374 116 368T171 328L229 286Z"></path></g><g data-mml-node="TeXAtom" transform="translate(361, -259.6) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g></g><g data-mml-node="mo" transform="translate(4427, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g><g data-mml-node="mrow" transform="translate(1097.1, -710)"><g data-mml-node="munder"><g data-mml-node="mo"><path data-c="2211" d="M61 748Q64 750 489 750H913L954 640Q965 609 976 579T993 533T999 516H979L959 517Q936 579 886 621T777 682Q724 700 655 705T436 710H319Q183 710 183 709Q186 706 348 484T511 259Q517 250 513 244L490 216Q466 188 420 134T330 27L149 -187Q149 -188 362 -188Q388 -188 436 -188T506 -189Q679 -189 778 -162T936 -43Q946 -27 959 6H999L913 -249L489 -250Q65 -250 62 -248Q56 -246 56 -239Q56 -234 118 -161Q186 -81 245 -11L428 206Q428 207 242 462L57 717L56 728Q56 744 61 748Z"></path></g><g data-mml-node="mi" transform="translate(1056, -285.4) scale(0.707)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g><g data-mml-node="msub" transform="translate(1564, 0)"><g data-mml-node="mi"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(716, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g></g></g><rect width="5016" height="60" x="120" y="220"></rect></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">而权重 </span><span style="cursor:pointer;" data-formula="w_{i,j}"><span data-formula="w_{i,j}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -443 1497.9 737.2" aria-hidden="true" style="vertical-align: -0.666ex;width: 3.389ex;height: 1.668ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(716, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 的定义如下：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="w_{i,j} = \| \mathbf{v}_i \times \mathbf{v}_j \|^2 = \sin^2(\theta_{i,j})
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -883.9 12300.7 1178.2" aria-hidden="true" style="max-width: 300%;vertical-align: -0.666ex;width: 27.83ex;height: 2.666ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(716, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g></g><g data-mml-node="mo" transform="translate(1775.6, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mo" transform="translate(2831.4, 0)"><path data-c="2225" d="M133 736Q138 750 153 750Q164 750 170 739Q172 735 172 250T170 -239Q164 -250 152 -250Q144 -250 138 -244L137 -243Q133 -241 133 -179T132 250Q132 731 133 736ZM329 739Q334 750 346 750Q353 750 361 744L362 743Q366 741 366 679T367 250T367 -178T362 -243L361 -244Q355 -250 347 -250Q335 -250 329 -239Q327 -235 327 250T329 739Z"></path></g><g data-mml-node="msub" transform="translate(3331.4, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="76" d="M401 444Q413 441 495 441Q568 441 574 444H580V382H510L409 156Q348 18 339 6Q331 -4 320 -4Q318 -4 313 -4T303 -3H288Q273 -3 264 12T221 102Q206 135 197 156L96 382H26V444H34Q49 441 145 441Q252 441 270 444H279V382H231L284 264Q335 149 338 149Q338 150 389 264T442 381Q442 382 418 382H394V444H401Z"></path></g></g><g data-mml-node="mi" transform="translate(607, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(4454.6, 0)"><path data-c="D7" d="M630 29Q630 9 609 9Q604 9 587 25T493 118L389 222L284 117Q178 13 175 11Q171 9 168 9Q160 9 154 15T147 29Q147 36 161 51T255 146L359 250L255 354Q174 435 161 449T147 471Q147 480 153 485T168 490Q173 490 175 489Q178 487 284 383L389 278L493 382Q570 459 587 475T609 491Q630 491 630 471Q630 464 620 453T522 355L418 250L522 145Q606 61 618 48T630 29Z"></path></g><g data-mml-node="msub" transform="translate(5454.8, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="76" d="M401 444Q413 441 495 441Q568 441 574 444H580V382H510L409 156Q348 18 339 6Q331 -4 320 -4Q318 -4 313 -4T303 -3H288Q273 -3 264 12T221 102Q206 135 197 156L96 382H26V444H34Q49 441 145 441Q252 441 270 444H279V382H231L284 264Q335 149 338 149Q338 150 389 264T442 381Q442 382 418 382H394V444H401Z"></path></g></g><g data-mml-node="mi" transform="translate(607, -150) scale(0.707)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g><g data-mml-node="msup" transform="translate(6403.1, 0)"><g data-mml-node="mo"><path data-c="2225" d="M133 736Q138 750 153 750Q164 750 170 739Q172 735 172 250T170 -239Q164 -250 152 -250Q144 -250 138 -244L137 -243Q133 -241 133 -179T132 250Q132 731 133 736ZM329 739Q334 750 346 750Q353 750 361 744L362 743Q366 741 366 679T367 250T367 -178T362 -243L361 -244Q355 -250 347 -250Q335 -250 329 -239Q327 -235 327 250T329 739Z"></path></g><g data-mml-node="mn" transform="translate(500, 413) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="mo" transform="translate(7584.5, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msup" transform="translate(8640.2, 0)"><g data-mml-node="mi"><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z"></path><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z" transform="translate(394, 0)"></path><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(672, 0)"></path></g><g data-mml-node="mn" transform="translate(1228, 413) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g><g data-mml-node="mo" transform="translate(10271.8, 0)"><path data-c="2061" d=""></path></g><g data-mml-node="mo" transform="translate(10271.8, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(10660.8, 0)"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="TeXAtom" transform="translate(469, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g></g><g data-mml-node="mo" transform="translate(11911.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">其中 </span><span style="cursor:pointer;" data-formula="\theta_{i,j}"><span data-formula="\theta_{i,j}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 1250.9 999.2" aria-hidden="true" style="vertical-align: -0.666ex;width: 2.83ex;height: 2.261ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g><g data-mml-node="TeXAtom" transform="translate(469, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 是两条直线的夹角。当直线趋于平行时，夹角接近 0，权重 </span><span style="cursor:pointer;" data-formula="w_{i,j}"><span data-formula="w_{i,j}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -443 1497.9 737.2" aria-hidden="true" style="vertical-align: -0.666ex;width: 3.389ex;height: 1.668ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="77" d="M580 385Q580 406 599 424T641 443Q659 443 674 425T690 368Q690 339 671 253Q656 197 644 161T609 80T554 12T482 -11Q438 -11 404 5T355 48Q354 47 352 44Q311 -11 252 -11Q226 -11 202 -5T155 14T118 53T104 116Q104 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Q21 293 29 315T52 366T96 418T161 441Q204 441 227 416T250 358Q250 340 217 250T184 111Q184 65 205 46T258 26Q301 26 334 87L339 96V119Q339 122 339 128T340 136T341 143T342 152T345 165T348 182T354 206T362 238T373 281Q402 395 406 404Q419 431 449 431Q468 431 475 421T483 402Q483 389 454 274T422 142Q420 131 420 107V100Q420 85 423 71T442 42T487 26Q558 26 600 148Q609 171 620 213T632 273Q632 306 619 325T593 357T580 385Z"></path></g><g data-mml-node="TeXAtom" transform="translate(716, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(623, 0)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 趋于零，导致分母极小，计算结果在数值上彻底崩溃，产生巨大的方差。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图3和图4展示了这两种失效模式的原理和实验验证" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175517" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.9912718204488778" data-w="802" src="https://wechat2rss.xlab.app/img-proxy/?k=740fabbe&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicb1MmTlG2YKpHW6tfPHwhIKnTesUGHv3u11MrAW2TAAA9kJiaxhxNfwumHdLacc8RluBKd9H25hg8JX3yedPZicmuyMLtaROIiaY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图3和图4展示了这两种失效模式的原理和实验验证</span></figcaption></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图4的合成实验证实了边界区域的极高不稳定性" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175520" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="1.062111801242236" data-w="805" src="https://wechat2rss.xlab.app/img-proxy/?k=4e8ac1d5&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWib53wLRHZpUicWBXssOtkGGqFT6KyXyvZQehmWQKaB1PZuA52l9DxTe004HC3c58qsZ2M8fLaMEmc5PjJ4gKwshcRaaZZqvJ58U%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图4的合成实验证实了边界区域的极高不稳定性</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 位姿求解与退化规避</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在服务器端，定位系统使用 </span><b><span leaf="">l6P 求解器</span></b><span leaf="">。该求解器通过分离旋转 </span><span style="cursor:pointer;" data-formula="\mathbf{R}"><span data-formula="\mathbf{R}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -686 862 697" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.95ex;height: 1.577ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="52" d="M394 0Q370 3 222 3Q75 3 51 0H39V62H147V624H39V686H234Q256 686 299 686T362 687Q479 687 554 669T681 593Q716 550 716 497Q716 390 568 338Q569 337 572 336T577 332Q605 317 623 300T650 258T662 218T668 172Q678 98 689 76Q707 40 748 40Q770 40 780 54T795 88T801 111Q805 117 827 117H831Q846 117 852 113T858 92Q857 78 852 63T834 30T797 1T739 -11Q630 -11 580 12T511 87Q506 104 506 168Q506 170 506 178T507 194Q507 289 438 313Q424 318 356 318H298V62H406V0H394ZM366 369Q459 370 490 381Q548 402 548 476V498V517Q548 578 513 600Q479 624 392 624H358H298V369H366Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 和平移 </span><span style="cursor:pointer;" data-formula="\mathbf{t}"><span data-formula="\mathbf{t}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -635 447 640" aria-hidden="true" style="vertical-align: -0.011ex;width: 1.011ex;height: 1.448ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="74" d="M272 49Q320 49 320 136V145V177H382V143Q382 106 380 99Q374 62 349 36T285 -2L272 -5H247Q173 -5 134 27Q109 46 102 74T94 160Q94 171 94 199T95 245V382H21V433H25Q58 433 90 456Q121 479 140 523T162 621V635H224V444H363V382H224V239V207V149Q224 98 228 81T249 55Q261 49 272 49Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 来构建线性方程组。然而，如果 RANSAC 采样的 6 个点中有 3 个点来自同一个锚点，它们对应的 3D 平面法向量将共面，导致矩阵 </span><span style="cursor:pointer;" data-formula="\mathbf{N}_1"><span data-formula="\mathbf{N}_1"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -686 1303.6 836" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.949ex;height: 1.891ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4E" d="M314 0Q296 3 181 3T48 0H39V62H147V624H39V686H171H265Q288 686 297 686T309 684T315 679Q317 676 500 455T684 233V624H576V686H585Q603 683 718 683T851 686H860V624H752V319Q752 15 750 11Q747 4 742 2T718 0H712Q708 0 706 0T700 0T696 1T693 2T690 4T687 7T684 11T679 16T674 23Q671 27 437 311L215 579V62H323V0H314Z"></path></g></g><g data-mml-node="mn" transform="translate(900, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 秩亏（不可逆）。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了规避这种退化，DCL 在采样阶段加入了一个简单的逻辑检查：确保最小采样集中包含来自不同锚点的直线。这保证了法向量能张成完整的 3D 空间，从而使定位过程稳健。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验见真章：隐私与精度的双重考验</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队在 7Scenes、Cambridge 和 Aachen Day-Night 等多个数据集上进行了测试。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">隐私防御：暴涨的误差</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在隐私保护指标上，DCL 展现出了统治级的优势。在 Table 2 中可以看到，在 Aachen 数据集上，传统随机直线方法被攻击后，点的恢复误差仅为 5.38 像素；而 DCL 的误差直接飙升到了 </span><font color="#0000FF"><b><span leaf="">713.0 像素</span></b></font><span leaf="">！</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="Table 2 展示了 DCL 在点恢复误差和图像质量指标上的压倒性优势" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175518" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7334167709637046" data-w="799" src="https://wechat2rss.xlab.app/img-proxy/?k=380603cb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8AbAz1QzsytDJeDHpl2vEcQlSz6oYatApOgOviazO9hdRFzWOvHdzbrqVUvLQkmXCBiaENB0BQncCAKxWlCvvmvJBAEyH61c4Xo%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">Table 2 展示了 DCL 在点恢复误差和图像质量指标上的压倒性优势</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从定性结果来看，使用 DCL 后，反演网络重建出的图像完全是一团浆糊。即使攻击者试图通过 ×2 倍的放大视野来寻找这些点，也会发现它们大多飞到了图像区域之外。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图6展示了不同方法下的图像反演效果，DCL 的结果完全无法辨认" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175521" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7166666666666667" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=fdd0eecd&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibkG4ejwIbS5whPjCL75D55tdsq5T2E4ia0vpQdaibRqIXe5ZtRktx5lEiaXqUQIgDG4gZaGicv23nwQGShfF53uK5dYyj5L5M3GGM%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图6展示了不同方法下的图像反演效果，DCL 的结果完全无法辨认</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">定位性能：实用且高效</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">DCL 在保证隐私的同时，并没有牺牲太多定位精度。在 Cambridge 城市级场景中，DCL 的中值定位误差保持在 </span><font color="#0000FF"><b><span leaf="">25cm / 0.4°</span></b></font><span leaf=""> 左右。在挑战性的 Aachen Night 场景下，虽然召回率有所下降，但依然优于 ACE 等纯学习类方法。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="Table 3 展示了 Cambridge 数据集的定位结果" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175519" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7047146401985112" data-w="806" src="https://wechat2rss.xlab.app/img-proxy/?k=33e1b64e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibYXCtBAL4wk1SyjPzh9ZJphnicDVBhic2Sz99exPJNzDDqh9snSdNKZ5iaSCXYhernoDzd3CADuaJqGVEvJy0EABH4g7FcEiaESIA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">Table 3 展示了 Cambridge 数据集的定位结果</span></figcaption></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="Table 4 展示了 Aachen 数据集的详细表现" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175523" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.44374209860935526" data-w="791" src="https://wechat2rss.xlab.app/img-proxy/?k=c6c98e08&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8glDGPerWRzFw29CX95dsYcVMRrwA5icGtXWPPyicE4Ifv4ZNVOZPOjvylJq6aJbWLhalKNcic0bGXjfL1OYicq0yXCTNCV7JIIqw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">Table 4 展示了 Aachen 数据集的详细表现</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">此外，消融实验（Table 6）表明，锚点距离设为图像高度 </span><span style="cursor:pointer;" data-formula="H"><span data-formula="H"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 888 683" aria-hidden="true" style="vertical-align: 0px;width: 2.009ex;height: 1.545ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="48" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 219 683Q260 681 355 681Q389 681 418 681T463 682T483 682Q499 682 499 672Q499 670 497 658Q492 641 487 638H485Q483 638 480 638T473 638T464 637T455 637Q416 636 405 634T387 623Q384 619 355 500Q348 474 340 442T328 395L324 380Q324 378 469 378H614L615 381Q615 384 646 504Q674 619 674 627T617 637Q594 637 587 639T580 648Q580 650 582 660Q586 677 588 679T604 682Q609 682 646 681T740 680Q802 680 835 681T871 682Q888 682 888 672Q888 645 876 638H874Q872 638 869 638T862 638T853 637T844 637Q805 636 794 634T776 623Q773 618 704 340T634 58Q634 51 638 51Q646 48 692 46H723Q729 38 729 37T726 19Q722 6 716 0H701Q664 2 567 2Q533 2 504 2T458 2T437 1Q420 1 420 10Q420 15 423 24Q428 43 433 45Q437 46 448 46H454Q481 46 514 49Q520 50 522 50T528 55T534 64T540 82T547 110T558 153Q565 181 569 198Q602 330 602 331T457 332H312L279 197Q245 63 245 58Q245 51 253 49T303 46H334Q340 38 340 37T337 19Q333 6 327 0H312Q275 2 178 2Q144 2 115 2T69 2T48 1Q31 1 31 10Q31 12 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 时性能最佳。如果锚点分得太开，直线会变得过于平行，反而不利于位姿解算。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="Table 6 对锚点距离进行了消融实验" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175524" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.44095477386934673" data-w="796" src="https://wechat2rss.xlab.app/img-proxy/?k=b0977c9c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9Nq5Xibziag1gjOIBYvAsUXEW0Jl7ztfHmk3nZY0r2wHtkbDon1qVfBgoibx6NdCbrpyLnDAwYuu2WXWBmLvWLqLFe3gc3e1PTaw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">Table 6 对锚点距离进行了消融实验</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">更令人印象深刻的是速度。相比于需要运行复杂语义分割的方案，DCL 在 7Scenes 上实现了约 </span><font color="#0000FF"><b><span leaf="">4ms </span></b></font><span leaf="">的实时推理，在 Cambridge 上约为 </span><font color="#0000FF"><b><span leaf="">6ms</span></b></font><span leaf="">，凸显了其极高的实用性。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">相比之下，GSFF Privacy 在 Cambridge 数据集上的运行时间高达 45 秒。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">该CVPR Oral 论文研究聚焦于视觉定位的隐私问题。通过回归几何本质，用一种“四两拨千斤”的方式，利用数学上的不稳定性反制了复杂的深度学习攻击。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">DCL 的成功告诉我们：有时候最强大的防御并不一定来自更复杂的模型，而可能来自对基础几何逻辑的深刻洞察。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175526" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.125" data-w="960" src="https://wechat2rss.xlab.app/img-proxy/?k=941d4bf0&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGWibibNRficQtv97XWxBict61Miacicps6WjkQJics29miaiatF7BSoNkndibBNLy3sB56ia4NX3icoCkXNZnPWib83mvZrtcLzjztlyADX13BFg%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175525" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7064814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=882ea047&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW97utyIaAKkZ3oZ7nfVtvrS69JibaMcyPkFGRlyxyalbknmh9oicdQyLVSKicvicYBgxIlzI9b6SpkXBQ28hblYiafjXjtaKPfjeVms%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=1355d003&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659178%26idx%3D1%26sn%3D1b08734c5b4fb74721ed5ec62ce82549">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 27 Apr 2026 22:51:00 +0800</pubDate>
    </item>
    <item>
      <title>CVPR 2026 Oral | 3D 主动建图长程规划的新探索：MAGICIAN，让机器人“预见”未来再规划</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659111&amp;idx=1&amp;sn=a66bcda94c77acfc138a1745c0591970</link>
      <description>让机器人学会“想象”建图</description>
      <content:encoded><![CDATA[<p>原创 <span>CV君</span> <span>2026-04-26 23:09</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=c4c1f5fa&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGWicUUJk8goFBXBfeYWzkH1pT0TEaicgXHYFGiaExGPeEV6okndLCK4hOZVZnrD7OKHpZ6BvFq8ibuTAf8wwwKCqTibC5RTOJiczHg1x0%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>让机器人学会“想象”建图</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.2778649921507064" data-type="gif" data-w="637" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175451" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=3ea52067&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGW9wS5pEPyWXUdMBGeovF2H2FNFBAt3zdbuWkmgibwJ9N2b1mpHOKyViazWKMCkXnxUibqeAT5nCG54lUNdpP5WlDvXr2gcEibIl0xA%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">设想你置身于一个全然陌生的空间。 为了尽快掌握其全貌，你绝不会仅仅满足于“走一步、想一步、记一步”的机械堆砌，而是会结合过往的认知经验，在大脑中对未观测区域进行想象。比如，通过一段弧形的墙面，你或许能预判出一个环形大厅的存在，并据此提前规划探索路径。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种“基于先验、预构全局”的主动建模能力，对人类而言几近本能。然而在机器人领域，这一名为“主动建图（Active Mapping）”的任务却长期受困于一种“贪婪陷阱”：机器人往往只能依赖当前视野内的局部信息来寻找“最佳下一视角（Next-Best-View）”，导致其行为更像是在进行零散的碎片拼接，而非整体的构架推算。这种缺乏全局预构的探索方式，本质上是一种短视策略。由于无法对视线外的空间进行有效推断，机器人极易陷入局部最优的“死循环”。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">近日，来自巴黎综合理工学院以及法国国家信息与自动化研究所的研究团队，在 CVPR 2026 上发表了一项具有启发的工作：</span><font color="#0000FF"><b><span leaf="">MAGICIAN</span></b></font><span leaf="">（本意为“魔术师”）。它赋予了机器人一种“魔术师”般的预见能力——通过“想象”未见区域的几何结构，并利用 3D 高斯溅射（3D Gaussian Splatting, 3DGS）的极速渲染特性，实现了高效的长期轨迹规划。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175450" data-ratio="0.2796296296296296" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=418ba0ce&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicw9V9GwzH5fedydAcwz20IAObQkf5sVcdFqF5188pjlXfCq2wwyhUFBGKibVoC1Fia2icMLQcuhAbBvTJowVG2J5JV58cK1tzVrw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2603.22650" target="_blank">https://arxiv.org/abs/2603.22650</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">项目主页</span></b><span leaf="">: <a href="https://shiyao-li.github.io/magician" target="_blank">https://shiyao-li.github.io/magician</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">代码仓库</span></b><span leaf="">: <a href="https://github.com/shiyao-li/magician（已开源）" target="_blank">https://github.com/shiyao-li/magician（已开源）</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">录用会议</span></b><span leaf="">: CVPR 2026 (Oral)</span></p><p></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">长期规划的“鸡生蛋”困境</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">主动建图的核心矛盾在于：为了规划一条最优的长路径，你需要知道环境的全貌；但你之所以要移动，正是因为环境还是未知的。这种“鸡生蛋”的困境导致大多数现有方法只能选择“走一步看一步”。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">虽然有些研究尝试引入长期规划，但面临着巨大的计算瓶颈。要评估成千上万条可能的路径，每一条路径都需要预测未来的观测增益。如果使用传统的蒙特卡洛采样或复杂的神经网络查询，计算量会呈指数级爆炸。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="MAGICIAN 在多样化环境中的高效探索展示，上图为从室外城堡到室内楼梯的完整重建效果" class="rich_pages wxw-img" data-ratio="0.6638888888888889" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175454" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=76b940fa&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8KmXjXjD7cjcrl11Cvu8XHbLsqas83MCoTicdBCKbA929pTVqgzB5jJZ1QHsnbU2BoHHwcWm6GoLcibgDpicnvgUeTbFG9ZNh5ia4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">MAGICIAN 在多样化环境中的高效探索展示，上图为从室外城堡到室内楼梯的完整重建效果</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">核心魔法：什么是“想象高斯”？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">MAGICIAN 的核心突破在于提出了一种全新的场景表示——</span><b><span leaf="">想象高斯（Imagined Gaussians）</span></b><span leaf="">。它巧妙地将深度学习的“结构预判”与 3D 高斯的“渲染效率”结合在了一起。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 脑补未见之境：占据预测</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">算法的第一步是利用一个预训练的神经占据网络（Occupancy Network）。这个网络在大量 3D 数据上训练过，拥有强大的“常识”。即使机器人只看到了桌子的一角，网络也能根据先验知识，预测出桌子剩下的部分以及周围墙壁的大致位置。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">输入是机器人过去所有的观测数据和位姿，输出则是一个概率场 </span><span style="cursor:pointer;" data-formula="\hat{\sigma}(\mathbf{x} | \mathcal{C}_t)"><span data-formula="\hat{\sigma}(\mathbf{x} | \mathcal{C}_t)"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -754 3066.3 1004" aria-hidden="true" style="vertical-align: -0.566ex;width: 6.937ex;height: 2.271ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g><g data-mml-node="mo" transform="translate(35.5, -40)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g><g data-mml-node="mo" transform="translate(571, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(960, 0)"><g data-mml-node="mi"><path data-c="78" d="M227 0Q212 3 121 3Q40 3 28 0H21V62H117L245 213L109 382H26V444H34Q49 441 143 441Q247 441 265 444H274V382H246L281 339Q315 297 316 297Q320 297 354 341L389 382H352V444H360Q375 441 466 441Q547 441 559 444H566V382H471L355 246L504 63L545 62H586V0H578Q563 3 469 3Q365 3 347 0H338V62H366Q366 63 326 112T285 163L198 63L217 62H235V0H227Z"></path></g></g><g data-mml-node="mo" transform="translate(1567, 0)"><path data-c="7C" d="M139 -249H137Q125 -249 119 -235V251L120 737Q130 750 139 750Q152 750 159 735V-235Q151 -249 141 -249H139Z"></path></g><g data-mml-node="msub" transform="translate(1845, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="43" d="M201 -25Q167 -25 136 -14T75 23T29 94T12 202Q12 290 50 394T161 574Q227 642 303 673T433 704Q435 705 457 705Q533 701 533 640Q533 606 507 548T464 474Q431 444 396 444Q381 444 381 453Q381 459 388 473T407 513T428 563Q433 580 433 594Q433 636 381 636Q314 636 260 594T175 489T128 363T112 247Q112 157 153 101T273 44Q347 44 398 121Q413 144 437 157T481 171Q496 171 496 160Q496 150 476 123Q426 56 350 16T201 -25Z"></path></g></g><g data-mml-node="mi" transform="translate(527, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(2677.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g></g></svg></span></span><span leaf="">，代表空间中某一点被占据的可能性。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 化虚为实：高斯表征</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了让规划变得飞快，作者并没有直接在概率场上做文章，而是将其转化为了 </span><b><span leaf="">3D 高斯原语</span></b><span leaf="">。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">不透明度（Opacity）</span></b><span leaf="">：直接对应占据网络预测的概率 </span><span style="cursor:pointer;" data-formula="\hat{\sigma}"><span data-formula="\hat{\sigma}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -754 571 765" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.292ex;height: 1.731ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g><g data-mml-node="mo" transform="translate(35.5, -40)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">。概率越高，高斯点越“实”。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">颜色（Color）</span></b><span leaf="">：这里被用来编码“新颖度（Novelty）” </span><span style="cursor:pointer;" data-formula="\hat{\gamma}"><span data-formula="\hat{\gamma}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -764 543 980" aria-hidden="true" style="vertical-align: -0.489ex;width: 1.229ex;height: 2.217ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="3B3" d="M31 249Q11 249 11 258Q11 275 26 304T66 365T129 418T206 441Q233 441 239 440Q287 429 318 386T371 255Q385 195 385 170Q385 166 386 166L398 193Q418 244 443 300T486 391T508 430Q510 431 524 431H537Q543 425 543 422Q543 418 522 378T463 251T391 71Q385 55 378 6T357 -100Q341 -165 330 -190T303 -216Q286 -216 286 -188Q286 -138 340 32L346 51L347 69Q348 79 348 100Q348 257 291 317Q251 355 196 355Q148 355 108 329T51 260Q49 251 47 251Q45 249 31 249Z"></path></g><g data-mml-node="mo" transform="translate(40.3, -30)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">。还没去过的地方，新颖度设为 1；去过的地方，新颖度设为 0。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="MAGICIAN 框架总览。通过占据模型更新想象高斯，再利用束搜索规划最优轨迹。" class="rich_pages wxw-img" data-ratio="0.5027777777777778" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175452" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=dd4d529b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicSnNECy3nrq8gnOK6elAj1eT6zG9CQRo6c98t6OwduIgvYhLemoVYSBMtM5O1iaZ40Cuw82o3eLMaxutKwmyzwib13ZuLV8lSts%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">MAGICIAN 框架总览。通过占据模型更新想象高斯，再利用束搜索规划最优轨迹。</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 极速渲染：将增益计算转化为“拍照”</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这是 MAGICIAN 最值得细细思考的地方。在评估一个候选位姿时，不再需要复杂的几何计算，而是直接利用 3D 高斯溅射的渲染公式：</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="I(\mathbf{p}) = \int_{0}^{+\infty} \hat{\sigma}(\mathbf{o} + s\mathbf{d} | \mathbf{C}_t) \cdot \hat{o}(\mathbf{o} + s\mathbf{d}, \mathbf{c}) \cdot \hat{\gamma}(\mathbf{o} + s\mathbf{d} | \mathbf{C}_t) ds,
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1500.3 25016.1 2412.2" aria-hidden="true" style="max-width: 300%;vertical-align: -2.063ex;width: 56.597ex;height: 5.457ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="49" d="M43 1Q26 1 26 10Q26 12 29 24Q34 43 39 45Q42 46 54 46H60Q120 46 136 53Q137 53 138 54Q143 56 149 77T198 273Q210 318 216 344Q286 624 286 626Q284 630 284 631Q274 637 213 637H193Q184 643 189 662Q193 677 195 680T209 683H213Q285 681 359 681Q481 681 487 683H497Q504 676 504 672T501 655T494 639Q491 637 471 637Q440 637 407 634Q393 631 388 623Q381 609 337 432Q326 385 315 341Q245 65 245 59Q245 52 255 50T307 46H339Q345 38 345 37T342 19Q338 6 332 0H316Q279 2 179 2Q143 2 113 2T65 2T43 1Z"></path></g><g data-mml-node="mo" transform="translate(504, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(893, 0)"><g data-mml-node="mi"><path data-c="70" d="M32 442L123 446Q214 450 215 450H221V409Q222 409 229 413T251 423T284 436T328 446T382 450Q480 450 540 388T600 223Q600 128 539 61T361 -6H354Q292 -6 236 28L227 34V-132H296V-194H287Q269 -191 163 -191Q56 -191 38 -194H29V-132H98V113V284Q98 330 97 348T93 370T83 376Q69 380 42 380H29V442H32ZM457 224Q457 303 427 349T350 395Q282 395 235 352L227 345V104L233 97Q274 45 337 45Q383 45 420 86T457 224Z"></path></g></g><g data-mml-node="mo" transform="translate(1532, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(2198.8, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="msubsup" transform="translate(3254.6, 0)"><g data-mml-node="mo"><path data-c="222B" d="M114 -798Q132 -824 165 -824H167Q195 -824 223 -764T275 -600T320 -391T362 -164Q365 -143 367 -133Q439 292 523 655T645 1127Q651 1145 655 1157T672 1201T699 1257T733 1306T777 1346T828 1360Q884 1360 912 1325T944 1245Q944 1220 932 1205T909 1186T887 1183Q866 1183 849 1198T832 1239Q832 1287 885 1296L882 1300Q879 1303 874 1307T866 1313Q851 1323 833 1323Q819 1323 807 1311T775 1255T736 1139T689 936T633 628Q574 293 510 -5T410 -437T355 -629Q278 -862 165 -862Q125 -862 92 -831T55 -746Q55 -711 74 -698T112 -685Q133 -685 150 -700T167 -741Q167 -789 114 -798Z"></path></g><g data-mml-node="TeXAtom" transform="translate(1071.6, 1088.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mi" transform="translate(778, 0)"><path data-c="221E" d="M55 217Q55 305 111 373T254 442Q342 442 419 381Q457 350 493 303L507 284L514 294Q618 442 747 442Q833 442 888 374T944 214Q944 128 889 59T743 -11Q657 -11 580 50Q542 81 506 128L492 147L485 137Q381 -11 252 -11Q166 -11 111 57T55 217ZM907 217Q907 285 869 341T761 397Q740 397 720 392T682 378T648 359T619 335T594 310T574 285T559 263T548 246L543 238L574 198Q605 158 622 138T664 94T714 61T765 51Q827 51 867 100T907 217ZM92 214Q92 145 131 89T239 33Q357 33 456 193L425 233Q364 312 334 337Q285 380 233 380Q171 380 132 331T92 214Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(556, -896.4) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mn"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(5800.1, 0)"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g><g data-mml-node="mo" transform="translate(35.5, -40)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g><g data-mml-node="mo" transform="translate(6371.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(6760.1, 0)"><g data-mml-node="mi"><path data-c="6F" d="M287 -5Q228 -5 182 10T109 48T63 102T39 161T32 219Q32 272 50 314T94 382T154 423T214 446T265 452H279Q319 452 326 451Q428 439 485 376T542 221Q542 156 514 108T442 33Q384 -5 287 -5ZM399 230V250Q399 280 398 298T391 338T372 372T338 392T282 401Q241 401 212 380Q190 363 183 334T175 230Q175 202 175 189T177 153T183 118T195 91T215 68T245 56T287 50Q348 50 374 84Q388 101 393 132T399 230Z"></path></g></g><g data-mml-node="mo" transform="translate(7557.3, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mi" transform="translate(8557.5, 0)"><path data-c="73" d="M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(9026.5, 0)"><g data-mml-node="mi"><path data-c="64" d="M351 686L442 690Q533 694 534 694H540V389Q540 327 540 253T539 163Q539 97 541 83T555 66Q569 62 596 62H609V31Q609 0 608 0Q588 0 510 -3T412 -6Q411 -6 411 16V38L401 31Q337 -6 265 -6Q159 -6 99 58T38 224Q38 265 51 303T92 375T165 429T272 449Q359 449 417 412V507V555Q417 597 415 607T402 620Q388 624 361 624H348V686H351ZM411 350Q362 399 291 399Q278 399 256 392T218 371Q195 351 189 320T182 238V221Q182 179 183 159T191 115T212 74Q241 46 288 46Q358 46 404 100L411 109V350Z"></path></g></g><g data-mml-node="mo" transform="translate(9665.5, 0)"><path data-c="7C" d="M139 -249H137Q125 -249 119 -235V251L120 737Q130 750 139 750Q152 750 159 735V-235Q151 -249 141 -249H139Z"></path></g><g data-mml-node="msub" transform="translate(9943.5, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="43" d="M64 343Q64 502 174 599T468 697Q502 697 533 691T586 674T623 655T647 639T657 632L694 663Q703 670 711 677T723 687T730 692T735 695T740 696T746 697Q759 697 762 692T766 668V627V489V449Q766 428 762 424T742 419H732H720Q699 419 697 436Q690 498 657 545Q611 618 532 632Q522 634 496 634Q356 634 286 553Q232 488 232 343T286 133Q355 52 497 52Q597 52 650 112T704 237Q704 248 709 251T729 254H735Q750 254 755 253T763 248T766 234Q766 136 680 63T469 -11Q285 -11 175 86T64 343Z"></path></g></g><g data-mml-node="mi" transform="translate(831, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(11079.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(11691, 0)"><path data-c="22C5" d="M78 250Q78 274 95 292T138 310Q162 310 180 294T199 251Q199 226 182 208T139 190T96 207T78 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(12191.2, 0)"><g data-mml-node="mover"><g data-mml-node="mi" transform="translate(7.5, 0)"><path data-c="6F" d="M201 -11Q126 -11 80 38T34 156Q34 221 64 279T146 380Q222 441 301 441Q333 441 341 440Q354 437 367 433T402 417T438 387T464 338T476 268Q476 161 390 75T201 -11ZM121 120Q121 70 147 48T206 26Q250 26 289 58T351 142Q360 163 374 216T388 308Q388 352 370 375Q346 405 306 405Q243 405 195 347Q158 303 140 230T121 120Z"></path></g><g data-mml-node="mo" transform="translate(55.6, -30)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g><g data-mml-node="mo" transform="translate(12746.8, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(13135.8, 0)"><g data-mml-node="mi"><path data-c="6F" d="M287 -5Q228 -5 182 10T109 48T63 102T39 161T32 219Q32 272 50 314T94 382T154 423T214 446T265 452H279Q319 452 326 451Q428 439 485 376T542 221Q542 156 514 108T442 33Q384 -5 287 -5ZM399 230V250Q399 280 398 298T391 338T372 372T338 392T282 401Q241 401 212 380Q190 363 183 334T175 230Q175 202 175 189T177 153T183 118T195 91T215 68T245 56T287 50Q348 50 374 84Q388 101 393 132T399 230Z"></path></g></g><g data-mml-node="mo" transform="translate(13933, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mi" transform="translate(14933.3, 0)"><path data-c="73" d="M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(15402.3, 0)"><g data-mml-node="mi"><path data-c="64" d="M351 686L442 690Q533 694 534 694H540V389Q540 327 540 253T539 163Q539 97 541 83T555 66Q569 62 596 62H609V31Q609 0 608 0Q588 0 510 -3T412 -6Q411 -6 411 16V38L401 31Q337 -6 265 -6Q159 -6 99 58T38 224Q38 265 51 303T92 375T165 429T272 449Q359 449 417 412V507V555Q417 597 415 607T402 620Q388 624 361 624H348V686H351ZM411 350Q362 399 291 399Q278 399 256 392T218 371Q195 351 189 320T182 238V221Q182 179 183 159T191 115T212 74Q241 46 288 46Q358 46 404 100L411 109V350Z"></path></g></g><g data-mml-node="mo" transform="translate(16041.3, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(16485.9, 0)"><g data-mml-node="mi"><path data-c="63" d="M447 131H458Q478 131 478 117Q478 112 471 95T439 51T377 9Q330 -6 286 -6Q196 -6 135 35Q39 96 39 222Q39 324 101 384Q169 453 286 453Q359 453 411 431T464 353Q464 319 445 302T395 284Q360 284 343 305T325 353Q325 380 338 396H333Q317 398 295 398H292Q280 398 271 397T245 390T218 373T197 338T183 283Q182 275 182 231Q182 199 184 180T193 132T220 85T270 57Q289 50 317 50H326Q385 50 414 115Q419 127 423 129T447 131Z"></path></g></g><g data-mml-node="mo" transform="translate(16996.9, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(17608.1, 0)"><path data-c="22C5" d="M78 250Q78 274 95 292T138 310Q162 310 180 294T199 251Q199 226 182 208T139 190T96 207T78 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(18108.4, 0)"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="3B3" d="M31 249Q11 249 11 258Q11 275 26 304T66 365T129 418T206 441Q233 441 239 440Q287 429 318 386T371 255Q385 195 385 170Q385 166 386 166L398 193Q418 244 443 300T486 391T508 430Q510 431 524 431H537Q543 425 543 422Q543 418 522 378T463 251T391 71Q385 55 378 6T357 -100Q341 -165 330 -190T303 -216Q286 -216 286 -188Q286 -138 340 32L346 51L347 69Q348 79 348 100Q348 257 291 317Q251 355 196 355Q148 355 108 329T51 260Q49 251 47 251Q45 249 31 249Z"></path></g><g data-mml-node="mo" transform="translate(40.3, -30)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g><g data-mml-node="mo" transform="translate(18651.4, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(19040.4, 0)"><g data-mml-node="mi"><path data-c="6F" d="M287 -5Q228 -5 182 10T109 48T63 102T39 161T32 219Q32 272 50 314T94 382T154 423T214 446T265 452H279Q319 452 326 451Q428 439 485 376T542 221Q542 156 514 108T442 33Q384 -5 287 -5ZM399 230V250Q399 280 398 298T391 338T372 372T338 392T282 401Q241 401 212 380Q190 363 183 334T175 230Q175 202 175 189T177 153T183 118T195 91T215 68T245 56T287 50Q348 50 374 84Q388 101 393 132T399 230Z"></path></g></g><g data-mml-node="mo" transform="translate(19837.6, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mi" transform="translate(20837.8, 0)"><path data-c="73" d="M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(21306.8, 0)"><g data-mml-node="mi"><path data-c="64" d="M351 686L442 690Q533 694 534 694H540V389Q540 327 540 253T539 163Q539 97 541 83T555 66Q569 62 596 62H609V31Q609 0 608 0Q588 0 510 -3T412 -6Q411 -6 411 16V38L401 31Q337 -6 265 -6Q159 -6 99 58T38 224Q38 265 51 303T92 375T165 429T272 449Q359 449 417 412V507V555Q417 597 415 607T402 620Q388 624 361 624H348V686H351ZM411 350Q362 399 291 399Q278 399 256 392T218 371Q195 351 189 320T182 238V221Q182 179 183 159T191 115T212 74Q241 46 288 46Q358 46 404 100L411 109V350Z"></path></g></g><g data-mml-node="mo" transform="translate(21945.8, 0)"><path data-c="7C" d="M139 -249H137Q125 -249 119 -235V251L120 737Q130 750 139 750Q152 750 159 735V-235Q151 -249 141 -249H139Z"></path></g><g data-mml-node="msub" transform="translate(22223.8, 0)"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="43" d="M64 343Q64 502 174 599T468 697Q502 697 533 691T586 674T623 655T647 639T657 632L694 663Q703 670 711 677T723 687T730 692T735 695T740 696T746 697Q759 697 762 692T766 668V627V489V449Q766 428 762 424T742 419H732H720Q699 419 697 436Q690 498 657 545Q611 618 532 632Q522 634 496 634Q356 634 286 553Q232 488 232 343T286 133Q355 52 497 52Q597 52 650 112T704 237Q704 248 709 251T729 254H735Q750 254 755 253T763 248T766 234Q766 136 680 63T469 -11Q285 -11 175 86T64 343Z"></path></g></g><g data-mml-node="mi" transform="translate(831, -150) scale(0.707)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g><g data-mml-node="mo" transform="translate(23360.1, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mi" transform="translate(23749.1, 0)"><path data-c="64" d="M366 683Q367 683 438 688T511 694Q523 694 523 686Q523 679 450 384T375 83T374 68Q374 26 402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487H491Q506 153 506 145Q506 140 503 129Q490 79 473 48T445 8T417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157Q33 205 53 255T101 341Q148 398 195 420T280 442Q336 442 364 400Q369 394 369 396Q370 400 396 505T424 616Q424 629 417 632T378 637H357Q351 643 351 645T353 664Q358 683 366 683ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g><g data-mml-node="mi" transform="translate(24269.1, 0)"><path data-c="73" d="M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z"></path></g><g data-mml-node="mo" transform="translate(24738.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">简单来说，只要在“想象高斯”的世界里对着候选方向“拍张照”，渲染出来的新颖度地图（Novelty Map）像素总和，就是这个位姿能带来的</span><b><span leaf="">表面覆盖增益</span></b><span leaf="">。得益于 GPU 对高斯渲染的极致优化，这个过程比之前的 SOTA 方法快了 </span><font color="#0000FF"><b><span leaf="">25倍</span></b></font><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="利用想象高斯计算覆盖增益的示意图，通过渲染出的新颖度图直接量化增益" class="rich_pages wxw-img" data-ratio="0.8323057953144266" data-type="png" data-w="811" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175453" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=7aaabac1&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9l9DhDesEkdMsdpeGr8ZQMMibVjPrclfYTrA4ajZicAG9EjexpiaxSsKSZEgMQV5wNj42fLfVrPlTsyZBLJxPgvJVBj1TCwTOzbQ%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">利用想象高斯计算覆盖增益的示意图，通过渲染出的新颖度图直接量化增益</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">束搜索：寻找全局最优路径</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">有了极速的增益评估手段，MAGICIAN 终于可以放开手脚进行长期规划了。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">算法采用了</span><b><span leaf="">束搜索（Beam Search）</span></b><span leaf="">策略：</span></p><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">从当前位置出发，模拟出 </span><span style="cursor:pointer;" data-formula="N_b"><span data-formula="N_b"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 1156.3 840.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 2.616ex;height: 1.902ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="4E" d="M234 637Q231 637 226 637Q201 637 196 638T191 649Q191 676 202 682Q204 683 299 683Q376 683 387 683T401 677Q612 181 616 168L670 381Q723 592 723 606Q723 633 659 637Q635 637 635 648Q635 650 637 660Q641 676 643 679T653 683Q656 683 684 682T767 680Q817 680 843 681T873 682Q888 682 888 672Q888 650 880 642Q878 637 858 637Q787 633 769 597L620 7Q618 0 599 0Q585 0 582 2Q579 5 453 305L326 604L261 344Q196 88 196 79Q201 46 268 46H278Q284 41 284 38T282 19Q278 6 272 0H259Q228 2 151 2Q123 2 100 2T63 2T46 1Q31 1 31 10Q31 14 34 26T39 40Q41 46 62 46Q130 49 150 85Q154 91 221 362L289 634Q287 635 234 637Z"></path></g><g data-mml-node="mi" transform="translate(803, -150) scale(0.707)"><path data-c="62" d="M73 647Q73 657 77 670T89 683Q90 683 161 688T234 694Q246 694 246 685T212 542Q204 508 195 472T180 418L176 399Q176 396 182 402Q231 442 283 442Q345 442 383 396T422 280Q422 169 343 79T173 -11Q123 -11 82 27T40 150V159Q40 180 48 217T97 414Q147 611 147 623T109 637Q104 637 101 637H96Q86 637 83 637T76 640T73 647ZM336 325V331Q336 405 275 405Q258 405 240 397T207 376T181 352T163 330L157 322L136 236Q114 150 114 114Q114 66 138 42Q154 26 178 26Q211 26 245 58Q270 81 285 114T318 219Q336 291 336 325Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 条可能的路径。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">在每一条路径的模拟过程中，一旦“想象高斯”被观测到，它的新颖度就会立刻在这一条路径的记忆中降为 0。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">不断扩展路径，最终选择总累积增益最高的轨迹执行。</span></p></li></ol><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种方式让机器人能够感知到：“如果我先去 A 点再去 B 点，虽然 A 点增益一般，但它能为我开启通往大厅的视野，长远来看比直接去 C 点更划算。”</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="想象高斯随时间演化的过程，可以看到它随着观测增加与真实网格越来越贴合" class="rich_pages wxw-img" data-ratio="0.30277777777777776" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175457" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=3d419569&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9aPN64NNbl3EfIwZX8pJ1IWejuAO2bxo57lZm24msjUBNoCywgUEl9Kw4LuDJLJKypmYrxsRHWmiao3nzMDDqPXYN8kibUPV1k4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">想象高斯随时间演化的过程，可以看到它随着观测增加与真实网格越来越贴合</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果：全方位的降维打击</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队在室内（MP3D）和大型室外（Macarons++）场景下对 MAGICIAN 进行了严苛的测试。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 覆盖率与效率的双重飞跃</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在 Macarons++ 数据集上，MAGICIAN 的最终覆盖率达到了 </span><font color="#0000FF"><b><span leaf="">91.9%</span></b></font><span leaf="">，</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">远超</span></strong><span leaf="">之前的 SOTA 方法 MACARONS（81.9%）和 FisherRF（78.6%）。更重要的是，反映探索效率的指标 AUC 提升了约 11%，这意味着机器人在更短的时间内完成了更多的任务。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="不同方法在 Macarons++ 数据集上的量化对比，MAGICIAN 在各项指标上均处于领先地位" class="rich_pages wxw-img" data-ratio="0.43320363164721143" data-type="png" data-w="771" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175456" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=50d306b7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW80R3BeVPe3bbU6oribicW1otG4LsDicbOrpH4OOyedJeWk0EruKnj3NymicffTPKvG5A269BFgGXQqHZxoYMKicUEVy633Xic9ELcNk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">不同方法在 Macarons++ 数据集上的量化对比，MAGICIAN 在各项指标上均处于领先地位</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 重建质量：告别“破洞”</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">由于 MAGICIAN 规划的路径更加完整，最终生成的 3D 模型也更加精致。在真实扫描场景的实验中，几何精度（Accuracy）达到了 </span><font color="#0000FF"><b><span leaf="">94.20%</span></b></font><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.4283783783783784" data-type="png" data-w="740" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175455" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=ad0e768b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8sMzQzzLeog8Xw3TyPvbwaKhMzt2icicK1a1mI3rSKiaq5dFLgxzMqAzQf7On4uRqEucAKJVibtJv523TpgO0D300dp9x6qrNqlFs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从视觉上看，MAGICIAN 重建的建筑表面平滑，几乎没有传统方法中常见的空洞和噪声。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="MAGICIAN 与其他方法在室内外场景下的定性对比，展示了其在表面重建上的完整性" class="rich_pages wxw-img" data-ratio="0.5166666666666667" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175459" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=e6e81949&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9lVUdbFHg9iazGCBH1SqEgjmA5hSseknp77onb6jv1VxUn5CuhTQlTbgmE5cGcNZkHo08Z0FpX7RxyrRPnGEqK6vjuM9na8WyY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">MAGICIAN 与其他方法在室内外场景下的定性对比，展示了其在表面重建上的完整性</span></figcaption></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="MAGICIAN 生成的 3D 重建效果，表面完整且纹理清晰，涵盖了多种复杂建筑" class="rich_pages wxw-img" data-ratio="0.3435185185185185" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175458" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=6f7055af&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibs0qQpPhEUdez1Kbv8uzBeXqrj8Xz2GmYpfSmz5eAl12RCMCJ45Wb34ktEdk48Vx4JgGbmcicXlDHk87sUt69cjuAsMwkCgJ9U%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">MAGICIAN 生成的 3D 重建效果，表面完整且纹理清晰，涵盖了多种复杂建筑</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 极强的鲁棒性</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">消融实验显示，MAGICIAN 对初始位姿的随机性表现得非常稳健。无论机器人从哪个角落出发，得益于强大的长期规划，最终的覆盖率标准差极低。相比之下，之前的其他方法往往会因为起步不好而“步步错”。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="不同方法在不同场景下的覆盖率标准差对比，MAGICIAN 表现最稳定，受随机初始位姿影响最小" class="rich_pages wxw-img" data-ratio="0.7194066749072929" data-type="png" data-w="809" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175460" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=e079b39a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8lvsEsNt3PFeM2E548szZgmqs3asq5otaO0CrHYH7tUQKT5sLpRPZ4tdM5NfV8YsqUvbp4UPokmiaq8P0RA7MWziaSWa0NeqKvQ%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">不同方法在不同场景下的覆盖率标准差对比，MAGICIAN 表现最稳定，受随机初始位姿影响最小</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">MAGICIAN 的成功，本质上是</span><b><span leaf="">将“预测”引入了“感知”</span></b><span leaf="">。它告诉我们，机器人不应该只是被动地接受环境，而应该在具备“常识”的情况下主动地去“想象”环境。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">通过将复杂的占据场转化为轻量化的 3D 高斯，MAGICIAN 绕过了长期规划的计算大山，这让机器人在实际部署中计算更友好。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前，作者已经将代码开源在 GitHub 上。如果你对自主建图或 3D 高斯感兴趣，MAGICIAN 是一个值得深入研究的基准。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-ratio="0.125" data-type="gif" data-w="960" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175461" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=d4745cbe&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW85jLXUlAlqKo6jhmVwq4Uh7YUOgPqvmwyCJFypdzVXJJthpkRoGxsLAyBXUu8gLA0k8icwEY3jickBegyicVdqetbrElYibAw4QK0%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-ratio="0.7064814814814815" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-imgfileid="100175462" data-aistatus="1" src="https://wechat2rss.xlab.app/img-proxy/?k=07cf6e7a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8UYJZI3rl9LicuRkr9BN7PjWodonYVAczH3bDa4YVyg14JOKuiczGMAJjtP2uUbahnkUjZNzs35fzEY8mwqxrlbAhMrbT5rJSvk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=b35efa18&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659111%26idx%3D1%26sn%3Da66bcda94c77acfc138a1745c0591970">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Sun, 26 Apr 2026 23:09:00 +0800</pubDate>
    </item>
    <item>
      <title>CVPR 2026 | 零样本计数新突破：西工大&amp;中国电信TeleAI提出QICA</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659078&amp;idx=1&amp;sn=f4b371672f3a4991e37368f96c3cf6a0</link>
      <description>速度也有优势</description>
      <content:encoded><![CDATA[<p><span>CV君</span> <span>2026-04-25 07:09</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=010ef3dd&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWicegw8cqpXyW2GS4bZAFmNnbI81xklaibmNYicIDECn6aZmnOSU3kW1RCOotiav5RMRToicwj2fJkWt92ouib9yaQzKicJUvSDOgEP78%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>速度也有优势</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175394" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2778649921507064" data-w="637" src="https://wechat2rss.xlab.app/img-proxy/?k=cdeceaaa&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGWibLvpAwKItlZAKusDAE78Lf41rzIFicqP6icWgvibiaXiceURPRWcVMpU9Bv8dFqicQib44IbCO49fMr4uzrhUOrz8gGHN97ZHyS91icN0%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在计算机视觉的众多任务中，“数数”看似简单，实则暗藏玄机。尤其是当我们要求模型在完全没见过某个类别、也没有任何视觉参考（Exemplar）的情况下，仅仅凭借一句“帮我数数图里有多少个草莓”就能给出准确答案时，这就是所谓的“零样本对象计数（Zero-Shot Object Counting, ZSOC）”。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">近日，来自西北工业大学、中国电信人工智能研究院（TeleAI）、中国科学技术大学以及复旦大学的研究团队，针对这一领域提出了一个具启发性的新框架：</span><b><span leaf="">QICA</span></b><span leaf="">，是 </span><b><span leaf="">Q</span></b><span leaf="">uantity percept</span><b><span leaf="">i</span></b><span leaf="">on with robust spatial </span><b><span leaf="">C</span></b><span leaf="">ast </span><b><span leaf="">A</span></b><span leaf="">ggregation 的缩写，意在强调其结合了“数量感知”与“鲁棒的空间代价聚合”能力。它不仅在标准的计数基准上表现出色，更在极高密度的人群计数场景中展现了良好的泛化能力。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175393" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2564814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=05f99156&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicmQvFNSZia81sQfxBfBldq8PkTY0nebJUEmmOAiaJXLibz4Y1UTibGwicY2xJWNR4ZIBslGVicIwsq4aCliajTo47M2j3IFl84BvkjDA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2603.16129" target="_blank">https://arxiv.org/abs/2603.16129</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">代码仓库</span></b><span leaf="">: <a href="https://github.com/zhangda1018/QICA" target="_blank">https://github.com/zhangda1018/QICA</a> (将开源)</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">录用会议</span></b><span leaf="">: CVPR 2026</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">为什么现在的模型“数不清”？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前的通用做法通常是利用像 CLIP 这样的预训练视觉-语言模型（Vision-Language Models, VLMs）。模型接收图像和文本，计算两者的相似度图，然后交给一个解码器去预测密度图。听起来很完美，但实际操作中存在两个“痛点”：</span></p><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">数量盲区（Quantity Blindness）</span></b><span leaf="">：现有的模型大多只学习了“语义对齐”，即模型知道什么是草莓，但它并不真正理解“1个草莓”和“10个草莓”在视觉特征上的细微差别。文本提示往往只包含类别名，缺乏对数量的显式监督。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">特征空间扭曲（Feature Space Distortion）</span></b><span leaf="">：为了让模型学会计数，开发者通常会微调 VLM。但直接微调往往会破坏 CLIP 原有的通用特征空间，导致模型在训练集里数得很好，一遇到没见过的类别就“抓瞎”了（即过拟合）。</span></p></li></ol><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="QICA 与标准 ZSOC 方法的对比。QICA 通过引入数值条件协同提示和代价聚合解码，解决了现有方法在数量感知和空间敏感性上的不足。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175392" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7700729927007299" data-w="822" src="https://wechat2rss.xlab.app/img-proxy/?k=38018f16&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8hc4Mw0jSZ2MnJDJmAQHnjr5sxk1gHDttloibcdXz4m1M2q7hNgaQ9DcIkEglVHghDcIX4YLoHpN1oxj5KqPwC11tsibmEAGkeU%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">QICA 与标准 ZSOC 方法的对比。QICA 通过引入数值条件协同提示和代价聚合解码，解决了现有方法在数量感知和空间敏感性上的不足。</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了解决这些问题，QICA 另辟蹊径，从“感知”和“解码”两个维度进行了重构。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">QICA 的核心：协同提示与代价聚合</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">QICA 的架构设计主要由三个核心组件构成：协同提示策略（SPS）、代价聚合解码器（CAD）以及多级数量对齐损失（</span><span style="cursor:pointer;" data-formula="\mathcal{L}_{MQA}"><span data-formula="\mathcal{L}_{MQA}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 2572.8 994.9" aria-hidden="true" style="vertical-align: -0.656ex;width: 5.821ex;height: 2.251ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -152.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4D" d="M289 629Q289 635 232 637Q208 637 201 638T194 648Q194 649 196 659Q197 662 198 666T199 671T201 676T203 679T207 681T212 683T220 683T232 684Q238 684 262 684T307 683Q386 683 398 683T414 678Q415 674 451 396L487 117L510 154Q534 190 574 254T662 394Q837 673 839 675Q840 676 842 678T846 681L852 683H948Q965 683 988 683T1017 684Q1051 684 1051 673Q1051 668 1048 656T1045 643Q1041 637 1008 637Q968 636 957 634T939 623Q936 618 867 340T797 59Q797 55 798 54T805 50T822 48T855 46H886Q892 37 892 35Q892 19 885 5Q880 0 869 0Q864 0 828 1T736 2Q675 2 644 2T609 1Q592 1 592 11Q592 13 594 25Q598 41 602 43T625 46Q652 46 685 49Q699 52 704 61Q706 65 742 207T813 490T848 631L654 322Q458 10 453 5Q451 4 449 3Q444 0 433 0Q418 0 415 7Q413 11 374 317L335 624L267 354Q200 88 200 79Q206 46 272 46H282Q288 41 289 37T286 19Q282 3 278 1Q274 0 267 0Q265 0 255 0T221 1T157 2Q127 2 95 1T58 0Q43 0 39 2T35 11Q35 13 38 25T43 40Q45 46 65 46Q135 46 154 86Q158 92 223 354T289 629Z"></path></g><g data-mml-node="mi" transform="translate(1051, 0)"><path data-c="51" d="M399 -80Q399 -47 400 -30T402 -11V-7L387 -11Q341 -22 303 -22Q208 -22 138 35T51 201Q50 209 50 244Q50 346 98 438T227 601Q351 704 476 704Q514 704 524 703Q621 689 680 617T740 435Q740 255 592 107Q529 47 461 16L444 8V3Q444 2 449 -24T470 -66T516 -82Q551 -82 583 -60T625 -3Q631 11 638 11Q647 11 649 2Q649 -6 639 -34T611 -100T557 -165T481 -194Q399 -194 399 -87V-80ZM636 468Q636 523 621 564T580 625T530 655T477 665Q429 665 379 640Q277 591 215 464T153 216Q153 110 207 59Q231 38 236 38V46Q236 86 269 120T347 155Q372 155 390 144T417 114T429 82T435 55L448 64Q512 108 557 185T619 334T636 468ZM314 18Q362 18 404 39L403 49Q399 104 366 115Q354 117 347 117Q344 117 341 117T337 118Q317 118 296 98T274 52Q274 18 314 18Z"></path></g><g data-mml-node="mi" transform="translate(1842, 0)"><path data-c="41" d="M208 74Q208 50 254 46Q272 46 272 35Q272 34 270 22Q267 8 264 4T251 0Q249 0 239 0T205 1T141 2Q70 2 50 0H42Q35 7 35 11Q37 38 48 46H62Q132 49 164 96Q170 102 345 401T523 704Q530 716 547 716H555H572Q578 707 578 706L606 383Q634 60 636 57Q641 46 701 46Q726 46 726 36Q726 34 723 22Q720 7 718 4T704 0Q701 0 690 0T651 1T578 2Q484 2 455 0H443Q437 6 437 9T439 27Q443 40 445 43L449 46H469Q523 49 533 63L521 213H283L249 155Q208 86 208 74ZM516 260Q516 271 504 416T490 562L463 519Q447 492 400 412L310 260L413 259Q516 259 516 260Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">）。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="QICA 的整体架构图。左侧 (a) 展示了 SPS 如何通过耦合函数将数量感知文本提示映射到视觉提示；右侧 (b) 展示了 CAD 如何在相似度图上进行空间聚合和上采样。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175396" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5268518518518519" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=3b588e38&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9BwYRCvY2zfz3l3uhU9PbwzOG20aa58cgxFGsO1l5ASGRv3Sibzm8vERiakZDrEtkhjhAhxsaJIe5erG8SVR5PudicBFtUXCNYgM%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">QICA 的整体架构图。左侧 (a) 展示了 SPS 如何通过耦合函数将数量感知文本提示映射到视觉提示；右侧 (b) 展示了 CAD 如何在相似度图上进行空间聚合和上采样。</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 协同提示策略（SPS）：给模型装上“数量秤”</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队认为，要让模型懂数量，就得在提示（Prompt）阶段下功夫。</span><b><span leaf="">协同提示策略（Synergistic Prompting Strategy, SPS）</span></b><span leaf=""> 不再孤立地处理视觉和文本分支。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">数值条件化</span></b><span leaf="">：它首先将离散的数量值 </span><span style="cursor:pointer;" data-formula="q"><span data-formula="q"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 460 636" aria-hidden="true" style="vertical-align: -0.439ex;width: 1.041ex;height: 1.439ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="71" d="M33 157Q33 258 109 349T280 441Q340 441 372 389Q373 390 377 395T388 406T404 418Q438 442 450 442Q454 442 457 439T460 434Q460 425 391 149Q320 -135 320 -139Q320 -147 365 -148H390Q396 -156 396 -157T393 -175Q389 -188 383 -194H370Q339 -192 262 -192Q234 -192 211 -192T174 -192T157 -193Q143 -193 143 -185Q143 -182 145 -170Q149 -154 152 -151T172 -148Q220 -148 230 -141Q238 -136 258 -53T279 32Q279 33 272 29Q224 -10 172 -10Q117 -10 75 30T33 157ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 转换为连续的嵌入向量 </span><span style="cursor:pointer;" data-formula="\boldsymbol{\epsilon}_q"><span data-formula="\boldsymbol{\epsilon}_q"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -444 858.3 731.2" aria-hidden="true" style="vertical-align: -0.65ex;width: 1.942ex;height: 1.654ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3F5" d="M415 89Q423 89 429 74T436 46Q436 43 434 39Q432 36 420 29T380 11T322 -5Q311 -7 281 -7Q216 -7 168 10T94 54T56 110T44 167V181Q44 262 94 329Q104 343 119 357T162 391T234 425T327 443Q328 443 348 443T383 444Q434 444 442 438Q450 430 450 416Q446 392 424 383L376 382Q306 381 278 369Q230 349 208 294Q199 274 199 268Q199 267 291 267Q305 267 325 267T353 268Q383 268 394 263T406 241Q406 214 380 206Q375 205 279 205T183 203Q174 176 174 140Q174 87 208 65T292 43Q295 43 300 43T307 44Q337 49 372 69T415 89Z"></path></g><g data-mml-node="mi" transform="translate(483, -150) scale(0.707)"><path data-c="71" d="M33 157Q33 258 109 349T280 441Q340 441 372 389Q373 390 377 395T388 406T404 418Q438 442 450 442Q454 442 457 439T460 434Q460 425 391 149Q320 -135 320 -139Q320 -147 365 -148H390Q396 -156 396 -157T393 -175Q389 -188 383 -194H370Q339 -192 262 -192Q234 -192 211 -192T174 -192T157 -193Q143 -193 143 -185Q143 -182 145 -170Q149 -154 152 -151T172 -148Q220 -148 230 -141Q238 -136 258 -53T279 32Q279 33 272 29Q224 -10 172 -10Q117 -10 75 30T33 157ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">。在训练时，模型不仅会看到真实的数量（如“16个草莓”），还会通过一种 </span><b><span leaf="">区间分箱策略（Interval-based binning strategy）</span></b><span leaf=""> 动态生成一些“反事实”的错误数量（如“13个”或“19个”）。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">双向协同</span></b><span leaf="">：最巧妙的地方在于，这些文本提示会通过一个耦合函数（Coupling Function, </span><span style="cursor:pointer;" data-formula="\Phi"><span data-formula="\Phi"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 722 683" aria-hidden="true" style="vertical-align: 0px;width: 1.633ex;height: 1.545ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3A6" d="M312 622Q310 623 307 625T303 629T297 631T286 634T270 635T246 636T211 637H184V683H196Q220 680 361 680T526 683H538V637H511Q468 637 447 635T422 631T411 622V533L425 531Q525 519 595 466T665 342Q665 301 642 267T583 209T506 172T425 152L411 150V61Q417 55 421 53T447 48T511 46H538V0H526Q502 3 361 3T196 0H184V46H211Q231 46 245 46T270 47T286 48T297 51T303 54T307 57T312 61V150H310Q309 151 289 153T232 166T160 195Q149 201 136 210T103 238T69 284T56 342Q56 414 128 467T294 530Q309 532 310 533H312V622ZM170 342Q170 207 307 188H312V495H309Q301 495 282 491T231 469T186 423Q170 389 170 342ZM415 188Q487 199 519 236T551 342Q551 384 539 414T507 459T470 481T434 491T415 495H410V188H415Z"></path></g></g></g><g></g></svg></span></span><span leaf="">）直接映射到视觉编码器的提示中。这种双向的梯度流动让视觉和语言编码器能够协同工作，共同理解“数量”这个概念。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><b><span leaf="">Input/Output 流程</span></b><span leaf="">：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">Input</span></b><span leaf="">：原始图像、类别文本描述、 ground-truth 数量及生成的反事实数量。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">Output</span></b><span leaf="">：注入了数量信息的文本嵌入 </span><span style="cursor:pointer;" data-formula="\mathbf{T}^{full}"><span data-formula="\mathbf{T}^{full}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -900.6 2064.8 900.6" aria-hidden="true" style="vertical-align: 0px;width: 4.672ex;height: 2.037ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="54" d="M41 425Q41 426 51 545T62 669V675H737V669Q738 665 748 546T758 425V419H696V425Q687 517 669 555T595 607Q578 612 522 613H478V62H631V0H615Q585 3 399 3Q214 3 184 0H168V62H321V613H277H263Q164 613 134 561Q113 527 103 425V419H41V425Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(800, 402.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="mi" transform="translate(550, 0)"><path data-c="75" d="M21 287Q21 295 30 318T55 370T99 420T158 442Q204 442 227 417T250 358Q250 340 216 246T182 105Q182 62 196 45T238 27T291 44T328 78L339 95Q341 99 377 247Q407 367 413 387T427 416Q444 431 463 431Q480 431 488 421T496 402L420 84Q419 79 419 68Q419 43 426 35T447 26Q469 29 482 57T512 145Q514 153 532 153Q551 153 551 144Q550 139 549 130T540 98T523 55T498 17T462 -8Q454 -10 438 -10Q372 -10 347 46Q345 45 336 36T318 21T296 6T267 -6T233 -11Q189 -11 155 7Q103 38 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(1122, 0)"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g><g data-mml-node="mi" transform="translate(1420, 0)"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf=""> 和视觉特征 </span><span style="cursor:pointer;" data-formula="\mathbf{V}"><span data-formula="\mathbf{V}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -686 869 693" aria-hidden="true" style="vertical-align: -0.016ex;width: 1.966ex;height: 1.568ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="56" d="M592 686H604Q615 685 631 685T666 684T700 684T724 683Q829 683 835 686H843V624H744L611 315Q584 254 546 165Q492 40 482 19T461 -6L460 -7H409Q398 -4 391 9Q385 20 257 315L124 624H25V686H36Q57 683 190 683Q340 683 364 686H377V624H289L384 403L480 185L492 212Q504 240 529 298T575 405L670 624H582V686H592Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li></ul><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 代价聚合解码器（CAD）：拒绝“特征污染”</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了避免微调导致的特征扭曲，QICA 提出了 </span><b><span leaf="">代价聚合解码器（Cost Aggregation Decoder, CAD）</span></b><span leaf="">。不同于以往直接处理高维视觉特征的方法，CAD 直接在“视觉-文本相似度图（Similarity Map）”上操作。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="CAD 流程的可视化。从原始图像到相似度图，再到空间聚合和最终融合，可以看到模型如何一步步抑制噪声并精准定位目标。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175395" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.6148148148148148" data-w="810" src="https://wechat2rss.xlab.app/img-proxy/?k=9e6e5794&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWib9HXkf16atfY8DJMgeRyMq4ricUibHpkBjxXRh9RDdJVU18QmAJR8a23gKnDQNLVIVCibSUmgNeqxIzmcxwC3w8LWPUydk3kmzyA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">CAD 流程的可视化。从原始图像到相似度图，再到空间聚合和最终融合，可以看到模型如何一步步抑制噪声并精准定位目标。</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">通过 Swin Transformer 块进行 </span><b><span leaf="">空间聚合（Spatial Aggregation）</span></b><span leaf="">，模型能够利用图像的结构信息来细化这些粗糙的相似度激活。CAD 就像是一个精细的过滤器，它能够识别出相似度图中的孤立噪声并予以剔除，同时增强那些符合物体空间分布的区域。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><b><span leaf="">Input/Output 流程</span></b><span leaf="">：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">Input</span></b><span leaf="">：密集视觉特征 </span><span style="cursor:pointer;" data-formula="\mathbf{V}"><span data-formula="\mathbf{V}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -686 869 693" aria-hidden="true" style="vertical-align: -0.016ex;width: 1.966ex;height: 1.568ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="56" d="M592 686H604Q615 685 631 685T666 684T700 684T724 683Q829 683 835 686H843V624H744L611 315Q584 254 546 165Q492 40 482 19T461 -6L460 -7H409Q398 -4 391 9Q385 20 257 315L124 624H25V686H36Q57 683 190 683Q340 683 364 686H377V624H289L384 403L480 185L492 212Q504 240 529 298T575 405L670 624H582V686H592Z"></path></g></g></g></g><g></g></svg></span></span><span leaf="">、仅含类别的文本嵌入 </span><span style="cursor:pointer;" data-formula="\mathbf{T}^{cat}"><span data-formula="\mathbf{T}^{cat}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -844.7 1785.5 844.7" aria-hidden="true" style="vertical-align: 0px;width: 4.04ex;height: 1.911ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="54" d="M41 425Q41 426 51 545T62 669V675H737V669Q738 665 748 546T758 425V419H696V425Q687 517 669 555T595 607Q578 612 522 613H478V62H631V0H615Q585 3 399 3Q214 3 184 0H168V62H321V613H277H263Q164 613 134 561Q113 527 103 425V419H41V425Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(800, 402.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="63" d="M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z"></path></g><g data-mml-node="mi" transform="translate(433, 0)"><path data-c="61" d="M33 157Q33 258 109 349T280 441Q331 441 370 392Q386 422 416 422Q429 422 439 414T449 394Q449 381 412 234T374 68Q374 43 381 35T402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487Q506 153 506 144Q506 138 501 117T481 63T449 13Q436 0 417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157ZM351 328Q351 334 346 350T323 385T277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q217 26 254 59T298 110Q300 114 325 217T351 328Z"></path></g><g data-mml-node="mi" transform="translate(962, 0)"><path data-c="74" d="M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">Output</span></b><span leaf="">：精细化的预测密度图 </span><span style="cursor:pointer;" data-formula="\hat{D}"><span data-formula="\hat{D}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1006 828 1006" aria-hidden="true" style="vertical-align: 0px;width: 1.873ex;height: 2.276ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="44" d="M287 628Q287 635 230 637Q207 637 200 638T193 647Q193 655 197 667T204 682Q206 683 403 683Q570 682 590 682T630 676Q702 659 752 597T803 431Q803 275 696 151T444 3L430 1L236 0H125H72Q48 0 41 2T33 11Q33 13 36 25Q40 41 44 43T67 46Q94 46 127 49Q141 52 146 61Q149 65 218 339T287 628ZM703 469Q703 507 692 537T666 584T629 613T590 629T555 636Q553 636 541 636T512 636T479 637H436Q392 637 386 627Q384 623 313 339T242 52Q242 48 253 48T330 47Q335 47 349 47T373 46Q499 46 581 128Q617 164 640 212T683 339T703 469Z"></path></g><g data-mml-node="mo" transform="translate(219.6, 212)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li></ul><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 多级数量对齐损失：严苛的“排序”监督</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了确保模型真的学到了数量逻辑，团队设计了 </span><b><span leaf="">多级数量对齐损失（Multi-level Quantity Alignment Loss, </span><span style="cursor:pointer;" data-formula="\mathcal{L}_{MQA}"><span data-formula="\mathcal{L}_{MQA}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 2572.8 994.9" aria-hidden="true" style="vertical-align: -0.656ex;width: 5.821ex;height: 2.251ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -152.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4D" d="M289 629Q289 635 232 637Q208 637 201 638T194 648Q194 649 196 659Q197 662 198 666T199 671T201 676T203 679T207 681T212 683T220 683T232 684Q238 684 262 684T307 683Q386 683 398 683T414 678Q415 674 451 396L487 117L510 154Q534 190 574 254T662 394Q837 673 839 675Q840 676 842 678T846 681L852 683H948Q965 683 988 683T1017 684Q1051 684 1051 673Q1051 668 1048 656T1045 643Q1041 637 1008 637Q968 636 957 634T939 623Q936 618 867 340T797 59Q797 55 798 54T805 50T822 48T855 46H886Q892 37 892 35Q892 19 885 5Q880 0 869 0Q864 0 828 1T736 2Q675 2 644 2T609 1Q592 1 592 11Q592 13 594 25Q598 41 602 43T625 46Q652 46 685 49Q699 52 704 61Q706 65 742 207T813 490T848 631L654 322Q458 10 453 5Q451 4 449 3Q444 0 433 0Q418 0 415 7Q413 11 374 317L335 624L267 354Q200 88 200 79Q206 46 272 46H282Q288 41 289 37T286 19Q282 3 278 1Q274 0 267 0Q265 0 255 0T221 1T157 2Q127 2 95 1T58 0Q43 0 39 2T35 11Q35 13 38 25T43 40Q45 46 65 46Q135 46 154 86Q158 92 223 354T289 629Z"></path></g><g data-mml-node="mi" transform="translate(1051, 0)"><path data-c="51" d="M399 -80Q399 -47 400 -30T402 -11V-7L387 -11Q341 -22 303 -22Q208 -22 138 35T51 201Q50 209 50 244Q50 346 98 438T227 601Q351 704 476 704Q514 704 524 703Q621 689 680 617T740 435Q740 255 592 107Q529 47 461 16L444 8V3Q444 2 449 -24T470 -66T516 -82Q551 -82 583 -60T625 -3Q631 11 638 11Q647 11 649 2Q649 -6 639 -34T611 -100T557 -165T481 -194Q399 -194 399 -87V-80ZM636 468Q636 523 621 564T580 625T530 655T477 665Q429 665 379 640Q277 591 215 464T153 216Q153 110 207 59Q231 38 236 38V46Q236 86 269 120T347 155Q372 155 390 144T417 114T429 82T435 55L448 64Q512 108 557 185T619 334T636 468ZM314 18Q362 18 404 39L403 49Q399 104 366 115Q354 117 347 117Q344 117 341 117T337 118Q317 118 296 98T274 52Q274 18 314 18Z"></path></g><g data-mml-node="mi" transform="translate(1842, 0)"><path data-c="41" d="M208 74Q208 50 254 46Q272 46 272 35Q272 34 270 22Q267 8 264 4T251 0Q249 0 239 0T205 1T141 2Q70 2 50 0H42Q35 7 35 11Q37 38 48 46H62Q132 49 164 96Q170 102 345 401T523 704Q530 716 547 716H555H572Q578 707 578 706L606 383Q634 60 636 57Q641 46 701 46Q726 46 726 36Q726 34 723 22Q720 7 718 4T704 0Q701 0 690 0T651 1T578 2Q484 2 455 0H443Q437 6 437 9T439 27Q443 40 445 43L449 46H469Q523 49 533 63L521 213H283L249 155Q208 86 208 74ZM516 260Q516 271 504 416T490 562L463 519Q447 492 400 412L310 260L413 259Q516 259 516 260Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">）</span></b><span leaf="">。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在编码器级别，它引入了一个排序约束：真实数量的提示与图像的相似度必须最高，且数值越接近真实值的提示，其相似度得分也应该越高。</span></p><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;" data-tool="mdnice编辑器"><p data-formula="\mathcal{L}_{\text{enc}}^{\text{qty}} = \frac{1}{K-1} \sum_{i=1}^{K-1} f(\alpha_i - \alpha_0) + \frac{1}{K-3} \sum_{i=1}^{\frac{K-1}{2}-1} \left[ f(\alpha_i - \alpha_{i+1}) + f(\alpha_{\frac{K+1}{2}+i} - \alpha_{\frac{K+1}{2}+i+1}) \right] \quad 
" style="text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -2027.9 36979.2 3273.8" aria-hidden="true" style="max-width: 300%;vertical-align: -2.819ex;width: 83.663ex;height: 7.407ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, 432.1) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="71" d="M33 218Q33 308 95 374T236 441H246Q330 441 381 372L387 364Q388 364 404 403L420 442H457V156Q457 -132 458 -134Q462 -142 470 -145Q491 -148 519 -148H535V-194H527L504 -193Q480 -192 453 -192T415 -191Q312 -191 303 -194H295V-148H311Q339 -148 360 -145Q369 -141 371 -135T373 -106V-41V49Q313 -11 236 -11Q154 -11 94 53T33 218ZM376 300Q346 389 278 401Q275 401 269 401T261 402Q211 400 171 350T131 214Q131 137 165 82T253 27Q296 27 328 54T376 118V300Z"></path><path data-c="74" d="M27 422Q80 426 109 478T141 600V615H181V431H316V385H181V241Q182 116 182 100T189 68Q203 29 238 29Q282 29 292 100Q293 108 293 146V181H333V146V134Q333 57 291 17Q264 -10 221 -10Q187 -10 162 2T124 33T105 68T98 100Q97 107 97 248V385H18V422H27Z" transform="translate(528, 0)"></path><path data-c="79" d="M69 -66Q91 -66 104 -80T118 -116Q118 -134 109 -145T91 -160Q84 -163 97 -166Q104 -168 111 -168Q131 -168 148 -159T175 -138T197 -106T213 -75T225 -43L242 0L170 183Q150 233 125 297Q101 358 96 368T80 381Q79 382 78 382Q66 385 34 385H19V431H26L46 430Q65 430 88 429T122 428Q129 428 142 428T171 429T200 430T224 430L233 431H241V385H232Q183 385 185 366L286 112Q286 113 332 227L376 341V350Q376 365 366 373T348 383T334 385H331V431H337H344Q351 431 361 431T382 430T405 429T422 429Q477 429 503 431H508V385H497Q441 380 422 345Q420 343 378 235T289 9T227 -131Q180 -204 113 -204Q69 -204 44 -177T19 -116Q19 -89 35 -78T69 -66Z" transform="translate(917, 0)"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -247) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="65" d="M28 218Q28 273 48 318T98 391T163 433T229 448Q282 448 320 430T378 380T406 316T415 245Q415 238 408 231H126V216Q126 68 226 36Q246 30 270 30Q312 30 342 62Q359 79 369 104L379 128Q382 131 395 131H398Q415 131 415 121Q415 117 412 108Q393 53 349 21T250 -11Q155 -11 92 58T28 218ZM333 275Q322 403 238 411H236Q228 411 220 410T195 402T166 381T143 340T127 274V267H333V275Z"></path><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(444, 0)"></path><path data-c="63" d="M370 305T349 305T313 320T297 358Q297 381 312 396Q317 401 317 402T307 404Q281 408 258 408Q209 408 178 376Q131 329 131 219Q131 137 162 90Q203 29 272 29Q313 29 338 55T374 117Q376 125 379 127T395 129H409Q415 123 415 120Q415 116 411 104T395 71T366 33T318 2T249 -11Q163 -11 99 53T34 214Q34 318 99 383T250 448T370 421T404 357Q404 334 387 320Z" transform="translate(1000, 0)"></path></g></g></g><g data-mml-node="mo" transform="translate(2039.5, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mfrac" transform="translate(3095.3, 0)"><g data-mml-node="mn" transform="translate(1275.7, 676)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mrow" transform="translate(220, -686)"><g data-mml-node="mi"><path data-c="4B" d="M285 628Q285 635 228 637Q205 637 198 638T191 647Q191 649 193 661Q199 681 203 682Q205 683 214 683H219Q260 681 355 681Q389 681 418 681T463 682T483 682Q500 682 500 674Q500 669 497 660Q496 658 496 654T495 648T493 644T490 641T486 639T479 638T470 637T456 637Q416 636 405 634T387 623L306 305Q307 305 490 449T678 597Q692 611 692 620Q692 635 667 637Q651 637 651 648Q651 650 654 662T659 677Q662 682 676 682Q680 682 711 681T791 680Q814 680 839 681T869 682Q889 682 889 672Q889 650 881 642Q878 637 862 637Q787 632 726 586Q710 576 656 534T556 455L509 418L518 396Q527 374 546 329T581 244Q656 67 661 61Q663 59 666 57Q680 47 717 46H738Q744 38 744 37T741 19Q737 6 731 0H720Q680 3 625 3Q503 3 488 0H478Q472 6 472 9T474 27Q478 40 480 43T491 46H494Q544 46 544 71Q544 75 517 141T485 216L427 354L359 301L291 248L268 155Q245 63 245 58Q245 51 253 49T303 46H334Q340 37 340 35Q340 19 333 5Q328 0 317 0Q314 0 280 1T180 2Q118 2 85 2T49 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Z"></path></g><g data-mml-node="mo" transform="translate(1111.2, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(2111.4, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><rect width="2811.4" height="60" x="120" y="220"></rect></g><g data-mml-node="munderover" transform="translate(6313.4, 0)"><g data-mml-node="mo" transform="translate(44.2, 0)"><path data-c="2211" d="M60 948Q63 950 665 950H1267L1325 815Q1384 677 1388 669H1348L1341 683Q1320 724 1285 761Q1235 809 1174 838T1033 881T882 898T699 902H574H543H251L259 891Q722 258 724 252Q725 250 724 246Q721 243 460 -56L196 -356Q196 -357 407 -357Q459 -357 548 -357T676 -358Q812 -358 896 -353T1063 -332T1204 -283T1307 -196Q1328 -170 1348 -124H1388Q1388 -125 1381 -145T1356 -210T1325 -294L1267 -449L666 -450Q64 -450 61 -448Q55 -446 55 -439Q55 -437 57 -433L590 177Q590 178 557 222T452 366T322 544L56 909L55 924Q55 945 60 948Z"></path></g><g data-mml-node="TeXAtom" transform="translate(192.3, -1087.9) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(1123, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(0, 1150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4B" d="M285 628Q285 635 228 637Q205 637 198 638T191 647Q191 649 193 661Q199 681 203 682Q205 683 214 683H219Q260 681 355 681Q389 681 418 681T463 682T483 682Q500 682 500 674Q500 669 497 660Q496 658 496 654T495 648T493 644T490 641T486 639T479 638T470 637T456 637Q416 636 405 634T387 623L306 305Q307 305 490 449T678 597Q692 611 692 620Q692 635 667 637Q651 637 651 648Q651 650 654 662T659 677Q662 682 676 682Q680 682 711 681T791 680Q814 680 839 681T869 682Q889 682 889 672Q889 650 881 642Q878 637 862 637Q787 632 726 586Q710 576 656 534T556 455L509 418L518 396Q527 374 546 329T581 244Q656 67 661 61Q663 59 666 57Q680 47 717 46H738Q744 38 744 37T741 19Q737 6 731 0H720Q680 3 625 3Q503 3 488 0H478Q472 6 472 9T474 27Q478 40 480 43T491 46H494Q544 46 544 71Q544 75 517 141T485 216L427 354L359 301L291 248L268 155Q245 63 245 58Q245 51 253 49T303 46H334Q340 37 340 35Q340 19 333 5Q328 0 317 0Q314 0 280 1T180 2Q118 2 85 2T49 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Z"></path></g><g data-mml-node="mo" transform="translate(889, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(1667, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g><g data-mml-node="mi" transform="translate(8012.4, 0)"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="mo" transform="translate(8562.4, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(8951.4, 0)"><g data-mml-node="mi"><path data-c="3B1" d="M34 156Q34 270 120 356T309 442Q379 442 421 402T478 304Q484 275 485 237V208Q534 282 560 374Q564 388 566 390T582 393Q603 393 603 385Q603 376 594 346T558 261T497 161L486 147L487 123Q489 67 495 47T514 26Q528 28 540 37T557 60Q559 67 562 68T577 70Q597 70 597 62Q597 56 591 43Q579 19 556 5T512 -10H505Q438 -10 414 62L411 69L400 61Q390 53 370 41T325 18T267 -2T203 -11Q124 -11 79 39T34 156ZM208 26Q257 26 306 47T379 90L403 112Q401 255 396 290Q382 405 304 405Q235 405 183 332Q156 292 139 224T121 120Q121 71 146 49T208 26Z"></path></g><g data-mml-node="mi" transform="translate(640, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(10107.6, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="msub" transform="translate(11107.8, 0)"><g data-mml-node="mi"><path data-c="3B1" d="M34 156Q34 270 120 356T309 442Q379 442 421 402T478 304Q484 275 485 237V208Q534 282 560 374Q564 388 566 390T582 393Q603 393 603 385Q603 376 594 346T558 261T497 161L486 147L487 123Q489 67 495 47T514 26Q528 28 540 37T557 60Q559 67 562 68T577 70Q597 70 597 62Q597 56 591 43Q579 19 556 5T512 -10H505Q438 -10 414 62L411 69L400 61Q390 53 370 41T325 18T267 -2T203 -11Q124 -11 79 39T34 156ZM208 26Q257 26 306 47T379 90L403 112Q401 255 396 290Q382 405 304 405Q235 405 183 332Q156 292 139 224T121 120Q121 71 146 49T208 26Z"></path></g><g data-mml-node="mn" transform="translate(640, -150) scale(0.707)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g></g><g data-mml-node="mo" transform="translate(12151.4, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(12762.6, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mfrac" transform="translate(13762.8, 0)"><g data-mml-node="mn" transform="translate(1275.7, 676)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mrow" transform="translate(220, -686)"><g data-mml-node="mi"><path data-c="4B" d="M285 628Q285 635 228 637Q205 637 198 638T191 647Q191 649 193 661Q199 681 203 682Q205 683 214 683H219Q260 681 355 681Q389 681 418 681T463 682T483 682Q500 682 500 674Q500 669 497 660Q496 658 496 654T495 648T493 644T490 641T486 639T479 638T470 637T456 637Q416 636 405 634T387 623L306 305Q307 305 490 449T678 597Q692 611 692 620Q692 635 667 637Q651 637 651 648Q651 650 654 662T659 677Q662 682 676 682Q680 682 711 681T791 680Q814 680 839 681T869 682Q889 682 889 672Q889 650 881 642Q878 637 862 637Q787 632 726 586Q710 576 656 534T556 455L509 418L518 396Q527 374 546 329T581 244Q656 67 661 61Q663 59 666 57Q680 47 717 46H738Q744 38 744 37T741 19Q737 6 731 0H720Q680 3 625 3Q503 3 488 0H478Q472 6 472 9T474 27Q478 40 480 43T491 46H494Q544 46 544 71Q544 75 517 141T485 216L427 354L359 301L291 248L268 155Q245 63 245 58Q245 51 253 49T303 46H334Q340 37 340 35Q340 19 333 5Q328 0 317 0Q314 0 280 1T180 2Q118 2 85 2T49 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Z"></path></g><g data-mml-node="mo" transform="translate(1111.2, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(2111.4, 0)"><path data-c="33" d="M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z"></path></g></g><rect width="2811.4" height="60" x="120" y="220"></rect></g><g data-mml-node="munderover" transform="translate(16980.9, 0)"><g data-mml-node="mo" transform="translate(427.2, 0)"><path data-c="2211" d="M60 948Q63 950 665 950H1267L1325 815Q1384 677 1388 669H1348L1341 683Q1320 724 1285 761Q1235 809 1174 838T1033 881T882 898T699 902H574H543H251L259 891Q722 258 724 252Q725 250 724 246Q721 243 460 -56L196 -356Q196 -357 407 -357Q459 -357 548 -357T676 -358Q812 -358 896 -353T1063 -332T1204 -283T1307 -196Q1328 -170 1348 -124H1388Q1388 -125 1381 -145T1356 -210T1325 -294L1267 -449L666 -450Q64 -450 61 -448Q55 -446 55 -439Q55 -437 57 -433L590 177Q590 178 557 222T452 366T322 544L56 909L55 924Q55 945 60 948Z"></path></g><g data-mml-node="TeXAtom" transform="translate(575.3, -1087.9) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="mn" transform="translate(1123, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(0, 1305) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mfrac"><g data-mml-node="mrow" transform="translate(220, 398) scale(0.707)"><g data-mml-node="mi"><path data-c="4B" d="M285 628Q285 635 228 637Q205 637 198 638T191 647Q191 649 193 661Q199 681 203 682Q205 683 214 683H219Q260 681 355 681Q389 681 418 681T463 682T483 682Q500 682 500 674Q500 669 497 660Q496 658 496 654T495 648T493 644T490 641T486 639T479 638T470 637T456 637Q416 636 405 634T387 623L306 305Q307 305 490 449T678 597Q692 611 692 620Q692 635 667 637Q651 637 651 648Q651 650 654 662T659 677Q662 682 676 682Q680 682 711 681T791 680Q814 680 839 681T869 682Q889 682 889 672Q889 650 881 642Q878 637 862 637Q787 632 726 586Q710 576 656 534T556 455L509 418L518 396Q527 374 546 329T581 244Q656 67 661 61Q663 59 666 57Q680 47 717 46H738Q744 38 744 37T741 19Q737 6 731 0H720Q680 3 625 3Q503 3 488 0H478Q472 6 472 9T474 27Q478 40 480 43T491 46H494Q544 46 544 71Q544 75 517 141T485 216L427 354L359 301L291 248L268 155Q245 63 245 58Q245 51 253 49T303 46H334Q340 37 340 35Q340 19 333 5Q328 0 317 0Q314 0 280 1T180 2Q118 2 85 2T49 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Z"></path></g><g data-mml-node="mo" transform="translate(889, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(1667, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="mn" transform="translate(809.4, -345) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><rect width="1732.3" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(1972.3, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mn" transform="translate(2750.3, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g><g data-mml-node="mrow" transform="translate(19279.2, 0)"><g data-mml-node="mo"><path data-c="5B" d="M224 -649V1150H455V1099H275V-598H455V-649H224Z"></path></g><g data-mml-node="mi" transform="translate(472, 0)"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="mo" transform="translate(1022, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(1411, 0)"><g data-mml-node="mi"><path data-c="3B1" d="M34 156Q34 270 120 356T309 442Q379 442 421 402T478 304Q484 275 485 237V208Q534 282 560 374Q564 388 566 390T582 393Q603 393 603 385Q603 376 594 346T558 261T497 161L486 147L487 123Q489 67 495 47T514 26Q528 28 540 37T557 60Q559 67 562 68T577 70Q597 70 597 62Q597 56 591 43Q579 19 556 5T512 -10H505Q438 -10 414 62L411 69L400 61Q390 53 370 41T325 18T267 -2T203 -11Q124 -11 79 39T34 156ZM208 26Q257 26 306 47T379 90L403 112Q401 255 396 290Q382 405 304 405Q235 405 183 332Q156 292 139 224T121 120Q121 71 146 49T208 26Z"></path></g><g data-mml-node="mi" transform="translate(640, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(2567.2, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="msub" transform="translate(3567.4, 0)"><g data-mml-node="mi"><path data-c="3B1" d="M34 156Q34 270 120 356T309 442Q379 442 421 402T478 304Q484 275 485 237V208Q534 282 560 374Q564 388 566 390T582 393Q603 393 603 385Q603 376 594 346T558 261T497 161L486 147L487 123Q489 67 495 47T514 26Q528 28 540 37T557 60Q559 67 562 68T577 70Q597 70 597 62Q597 56 591 43Q579 19 556 5T512 -10H505Q438 -10 414 62L411 69L400 61Q390 53 370 41T325 18T267 -2T203 -11Q124 -11 79 39T34 156ZM208 26Q257 26 306 47T379 90L403 112Q401 255 396 290Q382 405 304 405Q235 405 183 332Q156 292 139 224T121 120Q121 71 146 49T208 26Z"></path></g><g data-mml-node="TeXAtom" transform="translate(640, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(345, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mn" transform="translate(1123, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g><g data-mml-node="mo" transform="translate(5405, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(6016.3, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mi" transform="translate(7016.5, 0)"><path data-c="66" d="M118 -162Q120 -162 124 -164T135 -167T147 -168Q160 -168 171 -155T187 -126Q197 -99 221 27T267 267T289 382V385H242Q195 385 192 387Q188 390 188 397L195 425Q197 430 203 430T250 431Q298 431 298 432Q298 434 307 482T319 540Q356 705 465 705Q502 703 526 683T550 630Q550 594 529 578T487 561Q443 561 443 603Q443 622 454 636T478 657L487 662Q471 668 457 668Q445 668 434 658T419 630Q412 601 403 552T387 469T380 433Q380 431 435 431Q480 431 487 430T498 424Q499 420 496 407T491 391Q489 386 482 386T428 385H372L349 263Q301 15 282 -47Q255 -132 212 -173Q175 -205 139 -205Q107 -205 81 -186T55 -132Q55 -95 76 -78T118 -61Q162 -61 162 -103Q162 -122 151 -136T127 -157L118 -162Z"></path></g><g data-mml-node="mo" transform="translate(7566.5, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(7955.5, 0)"><g data-mml-node="mi"><path data-c="3B1" d="M34 156Q34 270 120 356T309 442Q379 442 421 402T478 304Q484 275 485 237V208Q534 282 560 374Q564 388 566 390T582 393Q603 393 603 385Q603 376 594 346T558 261T497 161L486 147L487 123Q489 67 495 47T514 26Q528 28 540 37T557 60Q559 67 562 68T577 70Q597 70 597 62Q597 56 591 43Q579 19 556 5T512 -10H505Q438 -10 414 62L411 69L400 61Q390 53 370 41T325 18T267 -2T203 -11Q124 -11 79 39T34 156ZM208 26Q257 26 306 47T379 90L403 112Q401 255 396 290Q382 405 304 405Q235 405 183 332Q156 292 139 224T121 120Q121 71 146 49T208 26Z"></path></g><g data-mml-node="TeXAtom" transform="translate(640, -269.3) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mfrac"><g data-mml-node="mrow" transform="translate(220, 398) scale(0.707)"><g data-mml-node="mi"><path data-c="4B" d="M285 628Q285 635 228 637Q205 637 198 638T191 647Q191 649 193 661Q199 681 203 682Q205 683 214 683H219Q260 681 355 681Q389 681 418 681T463 682T483 682Q500 682 500 674Q500 669 497 660Q496 658 496 654T495 648T493 644T490 641T486 639T479 638T470 637T456 637Q416 636 405 634T387 623L306 305Q307 305 490 449T678 597Q692 611 692 620Q692 635 667 637Q651 637 651 648Q651 650 654 662T659 677Q662 682 676 682Q680 682 711 681T791 680Q814 680 839 681T869 682Q889 682 889 672Q889 650 881 642Q878 637 862 637Q787 632 726 586Q710 576 656 534T556 455L509 418L518 396Q527 374 546 329T581 244Q656 67 661 61Q663 59 666 57Q680 47 717 46H738Q744 38 744 37T741 19Q737 6 731 0H720Q680 3 625 3Q503 3 488 0H478Q472 6 472 9T474 27Q478 40 480 43T491 46H494Q544 46 544 71Q544 75 517 141T485 216L427 354L359 301L291 248L268 155Q245 63 245 58Q245 51 253 49T303 46H334Q340 37 340 35Q340 19 333 5Q328 0 317 0Q314 0 280 1T180 2Q118 2 85 2T49 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Z"></path></g><g data-mml-node="mo" transform="translate(889, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mn" transform="translate(1667, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="mn" transform="translate(809.4, -345) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><rect width="1732.3" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(1972.3, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mi" transform="translate(2750.3, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g><g data-mml-node="mo" transform="translate(11056.4, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="msub" transform="translate(12056.6, 0)"><g data-mml-node="mi"><path data-c="3B1" d="M34 156Q34 270 120 356T309 442Q379 442 421 402T478 304Q484 275 485 237V208Q534 282 560 374Q564 388 566 390T582 393Q603 393 603 385Q603 376 594 346T558 261T497 161L486 147L487 123Q489 67 495 47T514 26Q528 28 540 37T557 60Q559 67 562 68T577 70Q597 70 597 62Q597 56 591 43Q579 19 556 5T512 -10H505Q438 -10 414 62L411 69L400 61Q390 53 370 41T325 18T267 -2T203 -11Q124 -11 79 39T34 156ZM208 26Q257 26 306 47T379 90L403 112Q401 255 396 290Q382 405 304 405Q235 405 183 332Q156 292 139 224T121 120Q121 71 146 49T208 26Z"></path></g><g data-mml-node="TeXAtom" transform="translate(640, -269.3) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mfrac"><g data-mml-node="mrow" transform="translate(220, 398) scale(0.707)"><g data-mml-node="mi"><path data-c="4B" d="M285 628Q285 635 228 637Q205 637 198 638T191 647Q191 649 193 661Q199 681 203 682Q205 683 214 683H219Q260 681 355 681Q389 681 418 681T463 682T483 682Q500 682 500 674Q500 669 497 660Q496 658 496 654T495 648T493 644T490 641T486 639T479 638T470 637T456 637Q416 636 405 634T387 623L306 305Q307 305 490 449T678 597Q692 611 692 620Q692 635 667 637Q651 637 651 648Q651 650 654 662T659 677Q662 682 676 682Q680 682 711 681T791 680Q814 680 839 681T869 682Q889 682 889 672Q889 650 881 642Q878 637 862 637Q787 632 726 586Q710 576 656 534T556 455L509 418L518 396Q527 374 546 329T581 244Q656 67 661 61Q663 59 666 57Q680 47 717 46H738Q744 38 744 37T741 19Q737 6 731 0H720Q680 3 625 3Q503 3 488 0H478Q472 6 472 9T474 27Q478 40 480 43T491 46H494Q544 46 544 71Q544 75 517 141T485 216L427 354L359 301L291 248L268 155Q245 63 245 58Q245 51 253 49T303 46H334Q340 37 340 35Q340 19 333 5Q328 0 317 0Q314 0 280 1T180 2Q118 2 85 2T49 1Q31 1 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Z"></path></g><g data-mml-node="mo" transform="translate(889, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mn" transform="translate(1667, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g><g data-mml-node="mn" transform="translate(809.4, -345) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g><rect width="1732.3" height="60" x="120" y="220"></rect></g><g data-mml-node="mo" transform="translate(1972.3, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mi" transform="translate(2750.3, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(3095.3, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="mn" transform="translate(3873.3, 0)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g><g data-mml-node="mo" transform="translate(15839, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(16228, 0)"><path data-c="5D" d="M16 1099V1150H247V-649H16V-598H196V1099H16Z"></path></g></g><g data-mml-node="mstyle" transform="translate(35979.2, 0)"><g data-mml-node="mspace"></g></g></g></g><g></g></svg></p></span><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种约束强迫模型在潜空间中建立起清晰的数值序关系。而在解码器级别，模型需要对每一个数量假设都预测一个密度图，并确保预测的总数与该假设的数值一致。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果：全线飘红的 SOTA</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">研究团队在多个极具挑战性的数据集上验证了 QICA 的实力。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. FSC-147：通用计数的标杆</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在包含 147 个类别的 FSC-147 数据集上，QICA（基于 ViT-L/14）在测试集上达到了 </span><font color="#0000FF"><b><span leaf="">12.41 MAE</span></b></font><span leaf=""> 和 </span><font color="#0000FF"><b><span leaf="">97.28 RMSE</span></b></font><span leaf="">。相比于之前的 CLIP-Count 等方法，性能提升了 27% 以上。即便与一些需要视觉参考（Few-shot）的方法相比，QICA 依然具竞争力。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="表 1 展示了 QICA 与其他 SOTA 模型在 FSC-147 上的对比，可以看到 QICA 在零样本设置下表现优异。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175401" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5314814814814814" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=98489bde&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9ibugyj09TAmaUauY38rpg06BkVdZiaib6cHhxnHRibw510q7JCnBzWqTTVg7txZcV2M8XLGufmjlUbUAiarq92ApY70h34aTRibGY4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">表 1 展示了 QICA 与其他 SOTA 模型在 FSC-147 上的对比，可以看到 QICA 在零样本设置下表现优异。</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 跨数据集泛化：CARPK 与人群计数</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">更令人惊喜的是 QICA 的跨领域泛化能力。在完全没见过 CARPK（停车场车辆计数）和 ShanghaiTech-A（极高密度人群计数）数据的情况下，QICA 直接进行推理：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">在 </span><b><span leaf="">ShanghaiTech-A</span></b><span leaf=""> 上，QICA 达到了 </span><font color="#0000FF"><b><span leaf="">140.7 MAE</span></b></font><span leaf="">，刷新了开源零样本计数方法的纪录。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">在 </span><b><span leaf="">CARPK</span></b><span leaf=""> 上，其表现（6.07 MAE）也显著优于 T2ICount 等扩散模型驱动的方法。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="表 2 显示 QICA 在 CARPK 数据集上的泛化表现。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175400" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.6763590391908976" data-w="791" src="https://wechat2rss.xlab.app/img-proxy/?k=36405343&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibbyuxzerB3Ix2FEUHTfv482A1NhYl6oicacFRnIhhu6jqXjdfgmn53ZTOM5Yglqbicia6sYVmNk8PHgkej4IO4lhZg8mUtfb54D8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">表 2 显示 QICA 在 CARPK 数据集上的泛化表现。</span></figcaption></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="表 3 显示 QICA 人群计数数据集上的卓越表现，甚至超过了专门针对接地任务设计的 CountGD。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175397" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7010050251256281" data-w="796" src="https://wechat2rss.xlab.app/img-proxy/?k=2d885892&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8mQ0r4S12FbLJtteJ9ghfRgADTQNoabawibeAD0DlicHMUIb8tL9icBRfsMV45EUAFqmYzBbbbqZxib7nicKuoq5kcbmIPjKtAyPRE%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">表 3 显示 QICA 人群计数数据集上的卓越表现，甚至超过了专门针对接地任务设计的 CountGD。</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 深度分析：提示深度与损失权重</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">通过消融实验，研究团队发现 </span><b><span leaf="">提示深度（Prompt Depth）</span></b><span leaf=""> 对性能有显著影响。在 1-9 层注入提示时效果最佳。此外，对损失权重 </span><span style="cursor:pointer;" data-formula="\lambda_1"><span data-formula="\lambda_1"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -694 986.6 844" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.232ex;height: 1.91ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mn" transform="translate(583, -150) scale(0.707)"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 和 </span><span style="cursor:pointer;" data-formula="\lambda_2"><span data-formula="\lambda_2"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -694 986.6 844" aria-hidden="true" style="vertical-align: -0.339ex;width: 2.232ex;height: 1.91ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3BB" d="M166 673Q166 685 183 694H202Q292 691 316 644Q322 629 373 486T474 207T524 67Q531 47 537 34T546 15T551 6T555 2T556 -2T550 -11H482Q457 3 450 18T399 152L354 277L340 262Q327 246 293 207T236 141Q211 112 174 69Q123 9 111 -1T83 -12Q47 -12 47 20Q47 37 61 52T199 187Q229 216 266 252T321 306L338 322Q338 323 288 462T234 612Q214 657 183 657Q166 657 166 673Z"></path></g><g data-mml-node="mn" transform="translate(583, -150) scale(0.707)"><path data-c="32" d="M109 429Q82 429 66 447T50 491Q50 562 103 614T235 666Q326 666 387 610T449 465Q449 422 429 383T381 315T301 241Q265 210 201 149L142 93L218 92Q375 92 385 97Q392 99 409 186V189H449V186Q448 183 436 95T421 3V0H50V19V31Q50 38 56 46T86 81Q115 113 136 137Q145 147 170 174T204 211T233 244T261 278T284 308T305 340T320 369T333 401T340 431T343 464Q343 527 309 573T212 619Q179 619 154 602T119 569T109 550Q109 549 114 549Q132 549 151 535T170 489Q170 464 154 447T109 429Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 的敏感性分析显示，适度的编码器级监督对建立数量感知至关重要。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图 4 展示了提示深度和长度对性能的影响。图 5 则展示了损失权重对最终结果的敏感性。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175399" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5540540540540541" data-w="814" src="https://wechat2rss.xlab.app/img-proxy/?k=fc73cbc7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicp7WzOoB7ubyW4YIZ3pkJC33V5DL4ZJHvbao2WGW9g1zzUUUA7RRnaaQeF9qaGkahpqEe4rp2jvrPFS8XXdNKhwnc2HoGpZxs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图 4 展示了提示深度和长度对性能的影响。图 5 则展示了损失权重对最终结果的敏感性。</span></figcaption></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图 5 权重敏感性分析。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175398" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.573729863692689" data-w="807" src="https://wechat2rss.xlab.app/img-proxy/?k=28f7ba89&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicWiagSVWtzTf5390HrMU078URxC2VfUmSX1TQAZZSy9CFq0cviacuxcmmFgMcicGJCkpnmTN2ial1gSCibjVYMSG3ZkQGoI4sqHsRs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图 5 权重敏感性分析。</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">4. 效率与可视化的双重胜利</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在效率方面，QICA 同样表现不俗。得益于冻结编码器和轻量化提示的设计，其可训练参数量仅为 19.7M 左右，在 NVIDIA A800 GPU 上可以达到 45.2 FPS 的推理速度，非常适合实际部署。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="效率分析。QICA 在参数量、计算开销和推理速度之间取得了极佳的平衡。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175403" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.6871165644171779" data-w="815" src="https://wechat2rss.xlab.app/img-proxy/?k=18c83c10&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9ibLtD7VQFvBF3wVSRleLcAeD84Xz6Wqrbt1Nl49l2JVlqRRb4mYaS7NQemibWPyW9El3r2k8kuo0bcP7hh467tiazj3uGr1YLD0%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">效率分析。QICA 在参数量、计算开销和推理速度之间取得了极佳的平衡。</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从可视化结果来看，QICA 生成的相似度图噪声极低，能够精准勾勒出目标的轮廓，这直接证明了 CAD 模块在空间细化方面的有效性。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="可视化对比。可以看到 QICA 生成的密度图（最右列）比 VLCounter 和 T2ICount 更加干净、精准。" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175406" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.8042394014962594" data-w="802" src="https://wechat2rss.xlab.app/img-proxy/?k=ad40f1de&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibicN1UZCNwXDMj41MfpKGRXmgTmjn7ianTMXJkTkzAib7NiaJMrCGIhJ7hw99hFKcPialc2mF8IE4CmA8gRJ6Fm1KD9lNuTH0y3jKA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">可视化对比。可以看到 QICA 生成的密度图（最右列）比 VLCounter 和 T2ICount 更加干净、精准。</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这项研究表明，在利用大模型处理下游任务时，</span><b><span leaf="">单纯的语义对齐是不够的，尤其是像计数这种对数值高度敏感的任务。</span></b></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">通过 SPS 引入数值先验，再通过 CAD 在相似度空间进行非侵入式的微调，QICA 成功在“保持泛化性”和“提升精确度”之间找到了一个平衡点。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175405" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.125" data-w="960" src="https://wechat2rss.xlab.app/img-proxy/?k=daead650&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW9O3s93T3xicScKBB96xGUUN6vzn5j2JKOlJgSJiavaibHMcMRXF88Sfmoq3IQ9sQicdxlvZWpvSXzeHgSeVCUkG25pvGtibELrJcFE%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175404" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7064814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=24f9c263&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8CckTbATgjaj1EAFlSEjtTspbBJnRL2bdNYUPXU9MNdxLewTOCicEHVFsB7mrFxpVYgeWJjBF1OfaVyDOicLsyGfhz7cpEWJ1EU%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=0e153df2&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659078%26idx%3D1%26sn%3Df4b371672f3a4991e37368f96c3cf6a0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Sat, 25 Apr 2026 07:09:00 +0800</pubDate>
    </item>
    <item>
      <title>ICLR 2026 | Meta开源Sapiens2：在10亿人像数据上训练出的人体视觉基础模型！</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247659077&amp;idx=1&amp;sn=8b5a811a9ec770ded432a3d5894274dd</link>
      <description>像素级还原人体细节。</description>
      <content:encoded><![CDATA[<p><span>CV君</span> <span>2026-04-24 23:04</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=b6d2e18b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWibjhAwhRGamXAicTc2BLhJkDO0HkG9EwXstqLufTl7qGJXEdhjFYQSsIycsfrh7lDd3mwbaw2M2sibHtLiaBqraTkLZd1yhOpibAR4%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>像素级还原人体细节。</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175410" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2778649921507064" data-w="637" src="https://wechat2rss.xlab.app/img-proxy/?k=ea525c1d&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGWicApoWwyWuwT9dfm4p9SSkzsXHiajIbMax7PbB8yKXib2X4Zo6Qj1os8GWtIHbNDXAAUjyic6szFBr2sP8qIIxJw5cA4UPVLOXLCE%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在计算机视觉的世界里，理解“人”始终是最核心也最复杂的课题之一。从精准的骨骼点定位到细腻的皮肤纹理还原，每一个细节的提升都意味着技术向真实世界的进一步跨越。去年，Meta 推出的 Sapiens （本意“智人”）系列模型曾引起不小的轰动，而今天我们要聊的是它的最新版——</span><b><span leaf="">Sapiens2</span></b><span leaf="">。相比第一代，Sapiens2 在任务通用性、图像适应力和输出保真度这三个维度上都进行了全方位的升级。它不仅能处理 1K 分辨率的图像，甚至通过层次化设计支持到了 4K 级别，参数量也一举冲到了 50 亿（5B）。简单来说，它想做的就是成为人体视觉领域的“全能基础模型”。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175409" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.21574074074074073" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=e93fb5e7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicraa3ibJH5KjAKEExv4FnJRvDnnqtoPOdia5JiaFfY2eXDQp7wURTRdtFTgZuWS6RMbzZ5DgeKe0yvqnEU5gc01WmJ29g11NmAico%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2604.21681" target="_blank">https://arxiv.org/abs/2604.21681</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">代码仓库</span></b><span leaf="">: <a href="https://github.com/facebookresearch/sapiens2" target="_blank">https://github.com/facebookresearch/sapiens2</a> (已开源)</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">录用会议</span></b><span leaf="">: ICLR 2026</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">背景与动机：为什么需要 Sapiens2？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在人体视觉任务中，我们通常面临两难的选择。一方面，像 </span><b><span leaf="">掩码图像建模</span></b><span leaf="">（Masked Image Modeling, MIM）这样的技术，擅长通过压缩和重建来捕捉底层的空间细节，但它在缺乏大量标注数据的情况下，语义理解能力稍显薄弱；另一方面，</span><b><span leaf="">对比学习</span></b><span leaf="">（Contrastive Learning, CL）虽然语义理解极强，却往往会因为过度追求“表观不变性”而丢失一些对密集预测至关重要的颜色和纹理细节，产生所谓的“表示漂移”现象。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">Meta 的研究团队意识到，想要构建一个真正的人体基础模型，必须把这两者的优势结合起来。于是，Sapiens2 诞生了。它通过在 10 亿张高质量人体图像上进行预训练，并巧妙地融合了重建任务和对比任务，成功解决了“细节”与“语义”不可兼得的矛盾。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="Sapiens2 在分割、深度和法线任务上的表现，相比一代有了质的飞跃" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175413" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="1.276851851851852" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=fad5f5f2&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibBpqc9C0NeWicD1y2K1mrQ10qcPQpeMpMYxyib6qQDFnWTR5e4t6J8eibS7Mk82xVKR5KgUqavbMDL6yyo4Tmag6yuQbYGTgZ8Ck%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">Sapiens2 在分割、深度和法线任务上的表现，相比一代有了质的飞跃</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">核心方法详解：10亿数据与混合预训练</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">Sapiens2 的强大首先源于它的“见多识广”。团队构建了一个名为 </span><b><span leaf="">Humans-1B</span></b><span leaf=""> 的数据集，包含约 10 亿张精挑细选的人体图像。这些图像覆盖了不同的年龄、肤色、背景和光照条件，确保了模型极强的泛化能力。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 混合预训练目标：细节与语义的握手</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">Sapiens2 的预训练不再是单一的“填空题”。它结合了两种损失函数：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">掩码重建损失 (</span><span style="cursor:pointer;" data-formula="\mathcal{L}_{\text{MAE}}"><span data-formula="\mathcal{L}_{\text{MAE}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 2400.3 857.7" aria-hidden="true" style="vertical-align: -0.345ex;width: 5.431ex;height: 1.94ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -152.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="4D" d="M132 622Q125 629 121 631T105 634T62 637H29V683H135Q221 683 232 682T249 675Q250 674 354 398L458 124L562 398Q666 674 668 675Q671 681 683 682T781 683H887V637H854Q814 636 803 634T785 622V61Q791 51 802 49T854 46H887V0H876Q855 3 736 3Q605 3 596 0H585V46H618Q660 47 669 49T688 61V347Q688 424 688 461T688 546T688 613L687 632Q454 14 450 7Q446 1 430 1T410 7Q409 9 292 316L176 624V606Q175 588 175 543T175 463T175 356L176 86Q187 50 261 46H278V0H269Q254 3 154 3Q52 3 37 0H29V46H46Q78 48 98 56T122 69T132 86V622Z"></path><path data-c="41" d="M255 0Q240 3 140 3Q48 3 39 0H32V46H47Q119 49 139 88Q140 91 192 245T295 553T348 708Q351 716 366 716H376Q396 715 400 709Q402 707 508 390L617 67Q624 54 636 51T687 46H717V0H708Q699 3 581 3Q458 3 437 0H427V46H440Q510 46 510 64Q510 66 486 138L462 209H229L209 150Q189 91 189 85Q189 72 209 59T259 46H264V0H255ZM447 255L345 557L244 256Q244 255 345 255H447Z" transform="translate(917, 0)"></path><path data-c="45" d="M128 619Q121 626 117 628T101 631T58 634H25V680H597V676Q599 670 611 560T625 444V440H585V444Q584 447 582 465Q578 500 570 526T553 571T528 601T498 619T457 629T411 633T353 634Q266 634 251 633T233 622Q233 622 233 621Q232 619 232 497V376H286Q359 378 377 385Q413 401 416 469Q416 471 416 473V493H456V213H416V233Q415 268 408 288T383 317T349 328T297 330Q290 330 286 330H232V196V114Q232 57 237 52Q243 47 289 47H340H391Q428 47 452 50T505 62T552 92T584 146Q594 172 599 200T607 247T612 270V273H652V270Q651 267 632 137T610 3V0H25V46H58Q100 47 109 49T128 61V619Z" transform="translate(1667, 0)"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">)</span></b><span leaf="">：让模型学习如何从残缺的图像中还原像素细节，这对后续的法线估计、反照率预测等任务至关重要。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">全局对比损失 (</span><span style="cursor:pointer;" data-formula="\mathcal{L}_{\text{CL}}"><span data-formula="\mathcal{L}_{\text{CL}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 1692.5 869.8" aria-hidden="true" style="vertical-align: -0.373ex;width: 3.829ex;height: 1.968ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="43" d="M56 342Q56 428 89 500T174 615T283 681T391 705Q394 705 400 705T408 704Q499 704 569 636L582 624L612 663Q639 700 643 704Q644 704 647 704T653 705H657Q660 705 666 699V419L660 413H626Q620 419 619 430Q610 512 571 572T476 651Q457 658 426 658Q322 658 252 588Q173 509 173 342Q173 221 211 151Q232 111 263 84T328 45T384 29T428 24Q517 24 571 93T626 244Q626 251 632 257H660L666 251V236Q661 133 590 56T403 -21Q262 -21 159 83T56 342Z"></path><path data-c="4C" d="M128 622Q121 629 117 631T101 634T58 637H25V683H36Q48 680 182 680Q324 680 348 683H360V637H333Q273 637 258 635T233 622L232 342V129Q232 57 237 52Q243 47 313 47Q384 47 410 53Q470 70 498 110T536 221Q536 226 537 238T540 261T542 272T562 273H582V268Q580 265 568 137T554 5V0H25V46H58Q100 47 109 49T128 61V622Z" transform="translate(722, 0)"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">)</span></b><span leaf="">：引入了类似 DINOv3 的学生-教师架构，通过匹配不同视图下的特征分布，让模型学会识别高层语义。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><b><span leaf="">Input/Output 流程</span></b><span leaf="">：在预训练阶段，</span><b><span leaf="">输入</span></b><span leaf="">是同一张图像的多个随机增强视图（包括全局和局部裁剪块），部分区域被随机掩码；</span><b><span leaf="">输出</span></b><span leaf="">则包含两部分：一是解码器重建的掩码区域像素，二是 [CLS] 标记生成的语义概率分布。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="Sapiens2 预训练流程图：结合了 MAE 的局部重建和对比学习的全局语义" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175411" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=46002d97&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicIHMqibicvhiblGDwm8dgMgZ87IadRPLKBBI3KA2FnLmgiawC7HA1mNuibps6InWR2frribBROTvVB13fVF6vxXeZ96Bfeqbw8X7knY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">Sapiens2 预训练流程图：结合了 MAE 的局部重建和对比学习的全局语义</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这种混合目标的效果立竿见影。如图 2 所示，Sapiens2 学习到的特征空间更具判别性，k-NN 检索出的邻居在语义和姿态上都更加接近。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图 2：基于 [CLS] 标记的 k-NN 对比，Sapiens2 的语义归类能力显著增强" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175412" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.44166666666666665" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=3a943332&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9Xz3wK32DvO3iaLj7VYOXzz056aic4ByQJBTPaicOr1tia7dY8yLRfJ429Dx4WXvWg8QPMvOBqGvEsicuvFbASzaWMlfrWBUdmHSl4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图 2：基于 [CLS] 标记的 k-NN 对比，Sapiens2 的语义归类能力显著增强</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">同时，如图 3 所示，模型在没有任何监督的情况下，就能产生非常聚焦于人体关键部位的 </span><b><span leaf="">人体中心注意力图</span></b><span leaf="">（Human-centric Attention Maps）。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图 3：模型末层的自注意力可视化，展现了极强的人体感知力" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175416" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.27685185185185185" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=62328506&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicpdMwsgVNfVcrHIicA3qGyHuzKBKWPNEhZcQxicI8WX5Mg4w3iaCbH98K7I0ppPWO4ViaZ9Wvs8drlcHsjn5zmynM2RvticetCV2hM%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图 3：模型末层的自注意力可视化，展现了极强的人体感知力</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 层次化 4K 架构设计</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了处理 4K 超高分辨率，Sapiens2 引入了层次化注意力机制。如果直接在 4K 图像上做全局自注意力，计算量会呈平方级爆炸。Sapiens2 的做法是：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">局部阶段</span></b><span leaf="">：前几层使用 </span><b><span leaf="">窗口化自注意力</span></b><span leaf="">（Windowed Self-Attention），只在局部区域内“看”细节，捕捉纹理和边界。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">全局阶段</span></b><span leaf="">：通过池化减少 Token 数量后，后几层再进行全局自注意力，从宏观上把握人体结构。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">此外，为了保证 5B 参数量在大规模训练时的稳定性，团队使用了 </span><b><span leaf="">归一化均方根层归一化</span></b><span leaf="">（Root Mean Square Layer Normalization, RMSNorm）替代 LayerNorm，并使用了 </span><b><span leaf="">QK-Norm</span></b><span leaf=""> 来防止高分辨率训练时的梯度不稳定。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="针对 4K 分辨率设计的窗口化自注意力机制" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175414" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7019089574155654" data-w="681" src="https://wechat2rss.xlab.app/img-proxy/?k=73ba2137&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicoXhh8XbCoFT80Y4n2to8RA2ngoTTmIr4lkW03CQjWWNhocuqj7w7e28hA2vUQGz3s0YAQUxSnCa846t85rumXfuEiaOBTqRWU%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">针对 4K 分辨率设计的窗口化自注意力机制</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">任务全能：从姿态到反照率</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在预训练完成后，Sapiens2 通过轻量级的任务头，在五大核心任务上展现了统治力：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">姿态估计 (Pose)</span></b><span leaf="">：支持 308 个关键点，涵盖全身、面部和手部。通过引入 10 万张真实场景的标注，Sapiens2 在复杂环境下的鲁棒性大大增强。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">部位分割 (Segmentation)</span></b><span leaf="">：词汇量扩展到了 29 类（新增了眼镜类），能够实现像素级的牙齿、唇部甚至耳环分割。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">几何预测 (Pointmap &amp; Normal)</span></b><span leaf="">：预测每像素的 3D 坐标和表面法线。得益于高保真合成数据的加入，模型对衣服褶皱和面部皱纹的刻画达到了惊人的水准。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">反照率估计 (Albedo)</span></b><span leaf="">：这是实现照片级重光照的关键，Sapiens2 能在多变的光影下还原出人体最真实的皮肤和衣物底色。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="后训练阶段的各种标注展示，包括 308 个关键点和 29 类分割" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175418" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=92535ce8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicqiapNic1DUoxcNcK7iaLspoO8zuwYcqSkd2HY4xPKWKSxibejfK4HBSl7svnq0G9pNU7r8omgCQNbiafUKqmKWwvrU6x0BN495iadw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">后训练阶段的各种标注展示，包括 308 个关键点和 29 类分割</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果：全面刷榜</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">实验数据最能直观体现 Sapiens2 的价值。在冻结主干网络进行探测（Dense Probing）时，Sapiens2-5B 在所有任务上都超越了 DINOv2、DINOv3 等强力基准。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="各模型在人体任务上的探测性能对比，Sapiens2-5B 全面领先" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175417" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5018518518518519" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=a5fe7afd&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWiba3Ok6wibP04afxdJIqIKhZ1mk6X4hssxmalPNEtB7VWbVK2FibnHQpnQAVg0ia6M9m2rwWYL0sVx3FhqRLUgC2B1Cesl6icicsbQU%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">各模型在人体任务上的探测性能对比，Sapiens2-5B 全面领先</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在具体任务微调后：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">姿态估计</span></b><span leaf="">：在 11K 测试集上达到了 </span><font color="#0000FF"><b><span leaf="">82.3 mAP</span></b></font><span leaf="">，相比一代提升了 4 个点。<img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175415" data-type="png" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-ratio="0.8027972027972028" data-w="715" src="https://wechat2rss.xlab.app/img-proxy/?k=63ad9d5e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9EGmEpLn4XteJxmibIJphnmk8f5CNdia8sltoVSeXdmCiazKvMoG6NXLV3wQDIWrnY6zHhaR4Jt7QQ2ke9EX1cbFSvTdeR5L7moI%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">部位分割</span></b><span leaf="">：提升最为夸张，mIoU 达到了 </span><font color="#0000FF"><b><span leaf="">82.5%</span></b></font><span leaf="">。即便与第一代最强的 Sapiens-2B 相比，mIoU 也提升了足足 </span><font color="#0000FF"><b><span leaf="">24.3</span></b></font><span leaf=""> 个百分点。<img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175420" data-type="png" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-ratio="1.0637450199203187" data-w="502" src="https://wechat2rss.xlab.app/img-proxy/?k=b0516174&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW84jiaoFccYWicjib9veYNKq47NPB3iaHlRR7yJTYpV9ZXETd2bAmkyl62FQX9txibczMrKqGJYDLXFVL2uHMs40Hico1oyMpcO5lZAA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">法线估计</span></b><span leaf="">：平均角度误差降至 </span><font color="#0000FF"><b><span leaf="">6.73°</span></b></font><span leaf="">，远优于之前的 SOTA 方法。<img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175421" data-type="png" style="display: block;margin: 10px auto;max-width: 100%;border-radius: 5px;object-fit: contain;height: auto !important;" data-ratio="0.5394862036156042" data-w="1051" src="https://wechat2rss.xlab.app/img-proxy/?k=b4b7feea&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8tIoUDovfshmLLHaicpGZlKJetT0uavgvPxg9GKXenQQMibmne22Hufqva0x2330dla5vTTeTmnfIfvZlKssnQZfZV4nHYheNk8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">定性对比同样震撼。如图 8 所示，相比于目前的 SOTA 模型 MoGe，Sapiens2 预测的点图（Pointmap）能够更精准地还原人体的几何轮廓。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图 8：点图定性对比，Sapiens2 对人体几何的还原更加精准" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175424" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.6462962962962963" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=67ff1e0b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWib3FSc5sG9XwT5DqAPTcMIrx3OUU3EEWEgjpu2ia72Q7YYpnHWcIevl4Bb1M6gKkHSARB4MUZSPEibAhC2alsVwicogQQdsLSX6fQ%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图 8：点图定性对比，Sapiens2 对人体几何的还原更加精准</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">图 9 则展示了模型在处理复杂服饰法线时的细腻程度，DAViD 等模型在细节处显得相对模糊。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="图 9：法线预测对比，Sapiens2 捕捉到了更细微的衣褶和面部细节" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175423" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.29907407407407405" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=a12d123f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibqPSIWm71SFd4USuXFbHuKtESPLwXXpUoZBcJdMRe8wpAP4kiaLIYrQnFzXfiaJtpibJ6uwsia01SuS2ic1rb4SpzG9ia8qwaDYhJmI%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">图 9：法线预测对比，Sapiens2 捕捉到了更细微的衣褶和面部细节</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">值得一提的是，即便是在 4K 分辨率下，Sapiens2 依然能保持极高的推理质量。图 7 展示了 1B-4K 模型在分割任务上的表现，基本达到了对发丝边缘的掌控力。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="1B-4K 模型带来的极高分割精度" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175422" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5409683426443203" data-w="1074" src="https://wechat2rss.xlab.app/img-proxy/?k=6f902e1c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWibMibRpV0t9CM0dia3eSAPNYBkFmloBKFzfxIxKribdYiaEn8yJ9ZHqwAz9aBDvDLmoK4fxF3bmqtmKHSvSCI5EfpcHROHKSiaFg3xE%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">1B-4K 模型带来的极高分割精度</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">Sapiens2 的出现，再次证明了“大数据+大模型+合适的预训练目标”在垂直领域的巨大潜力，也是Meta在视觉领域的又一重大贡献。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">如果你正在从事人体相关的视觉研究，Sapiens2 绝对是一个值得研究的宝库。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175425" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.125" data-w="960" src="https://wechat2rss.xlab.app/img-proxy/?k=22aa8f73&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGWibIYEFuHbd427lzgIOyzerGzFOVx0kC5kdPvhgiakQ2dusrHhicexPMVFtdjD650rQnRC5MyjUiaATiaAmmzntN7iawokgZOian3c3js%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175426" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7064814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=a2458157&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8X9mQydnRQg1VIXOyC5DzKM9MiaHnarW65D3gw6HXzufpDjTcWDsf4u3hDlYgLx6liarKeySBeJ6z33gBibaOic5BXWvJJ98K6kJE%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=bf33cb72&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247659077%26idx%3D1%26sn%3D8b5a811a9ec770ded432a3d5894274dd">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Fri, 24 Apr 2026 23:04:00 +0800</pubDate>
    </item>
    <item>
      <title>CVPR 2026 Findings | CoPS：让 CLIP 根据图像“现场合成”提示词，迈向更强的零样本异常检测</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247658981&amp;idx=1&amp;sn=3165acaf62ea85b7acdf567d48b1df33</link>
      <description></description>
      <content:encoded><![CDATA[<p>原创 <span>52CV</span> <span>2026-04-23 19:08</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=3ddb4956&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGW8J9Zd3cwYsM2UXs4UiakCvjhlCyL134QItSXeBIj3gdiajzSNkcgxNFxgKkAGNXyMqwpnoHBw4LVRU1DezSfuWE5qTkoj4XnmzU%2F0%3Fwx_fmt%3Djpeg"/></p>
  
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175324" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2778649921507064" data-w="637" src="https://wechat2rss.xlab.app/img-proxy/?k=ccab6d9e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGW9mNiaUcM2qXiaQCrSledXWTUfb1rph3lOick1ZT1yybXeJUEPeyl2IDl7iawdG4pw3XyEXIEjyV0rxeibsL5REETgUMDtyLOfsSQzo%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">异常检测是工业质检和医学影像中非常典型、也非常棘手的一类问题：我们希望模型能找出“哪里不正常”，但真实场景里异常样本往往稀缺、形态多变，而且新类别会不断出现。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">传统异常检测方法通常只在已知类别上学习“正常样本”的分布，一旦测试时换了新的物体、材质或医学模态，泛化能力就会明显下降。因此，</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">零样本异常检测</span></strong><span leaf="">成为近年来一个重要方向：模型只在辅助数据集上训练，却要在训练时没见过的工业和医学类别上完成异常分类与像素级定位。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这篇工作提出的 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">CoPS, Conditional Prompt Synthesis</span></strong><span leaf="">，正是围绕这个问题展开：与其为 CLIP 手工设计固定提示词，或者学习一组静态 prompt token，不如让模型根据当前图像的视觉特征，动态合成更适合这张图的提示词。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="CoPS 与已有 CLIP 异常检测方法的区别" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175327" data-type="jpeg" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7046296296296296" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=2d51a4ce&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGWibrcRPhmuJk0pOGxEUXZfnYSBnrpPRMAhnDerrudVIrl19AhtUtazLjqHzdft9vyMbVSIe7BGkmSSIt3v5wsw0CTaaIhf4a9iaI%2F640%3Fwx_fmt%3Djpeg%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">CoPS 与已有 CLIP 异常检测方法的区别</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><b><span leaf="">论文信息</span></b></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">标题</span></strong><span leaf="">：CoPS: Conditional Prompt Synthesis for Zero-Shot Anomaly Detection</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">录用</span></strong><span leaf="">：CVPR 2026 Findings</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">方向</span></strong><span leaf="">：零样本异常检测，Zero-Shot Anomaly Detection, ZSAD</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">作者</span></strong><span leaf="">：Qiyu Chen、Zhen Qu、Wei Luo、Haiming Yao、Yunkang Cao、Yuxin Jiang、Yinan Duan、Huiyuan Luo、Chengkan Lv、Zhengtao Zhang</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">单位</span></strong><span leaf="">：中科院自动化所、清华大学、湖南大学、华中科技大学</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">论文</span></strong><span leaf="">：<a href="https://arxiv.org/abs/2508.03447" target="_blank">https://arxiv.org/abs/2508.03447</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">代码</span></strong><span leaf="">：<a href="https://github.com/cqylunlun/CoPS" target="_blank">https://github.com/cqylunlun/CoPS</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">关键词</span></strong><span leaf="">：CLIP、视觉语言模型、Prompt Learning、工业缺陷检测、医学病灶定位</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">一、背景：为什么 prompt 是零样本异常检测的关键？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">CLIP 这类视觉语言模型之所以适合零样本任务，是因为它已经在大规模图文数据上学到了强大的跨模态对齐能力。对于异常检测，我们可以构造类似下面的文本提示：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">正常提示：</span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">a photo of a perfect screw</span></code></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">异常提示：</span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">a photo of a broken screw</span></code></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">然后比较图像特征与“正常文本”“异常文本”的相似度，得到图像级异常分数；再进一步把局部 patch 特征与文本特征对齐，得到像素级异常热力图。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">已有 CLIP-based ZSAD 方法大致分为两类：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">第一类是 Prompt Design。</span></strong><br/><span leaf="">例如通过人工设计大量模板，把“perfect / flawless / broken / damaged”等词组合起来。这类方法直观、可解释，但高度依赖专家经验和反复调参。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">第二类是 Prompt Learning。</span></strong><br/><span leaf="">例如把上下文词、状态词替换成可学习 token，让模型自动学习提示词表示。这减少了人工设计成本，但也带来一个新问题：学到的 token 往往是静态的，对所有测试图像都一样。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这篇论文指出，现有 prompt learning 在零样本异常检测中主要有两个痛点：</span></p><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">状态词太离散。</span></strong><br/><span leaf="">“normal / anomalous”或“good / damaged”只是粗粒度二分类，但真实异常往往是连续、多样的，例如划痕、缺口、污渍、病灶边界等形态差异很大。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">类别词太稀疏。</span></strong><br/><span leaf="">许多方法为了泛化，会把类别统一写成“object”。但这样会损失大量语义信息，模型容易过拟合到一个狭窄的文本语义空间。</span></p></li></ol><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">CoPS 的核心思想就是：</span><b><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">状态词和类别词不应该固定，而应该由图像特征条件化生成。</span></code></b></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">二、核心思路：Prompt 不再是固定句子，而是由图像驱动合成</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">CoPS 仍然基于 CLIP，但它把 prompt 拆成三个部分：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">context words</span></strong><span leaf="">：描述图像场景，例如“a photo of”</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">state words</span></strong><span leaf="">：描述正常或异常状态，例如“perfect / broken”</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">class words</span></strong><span leaf="">：描述类别语义，例如“screw”</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作者认为，context words 表示的是较通用的图像上下文，可以用静态可学习 token 表示；而 state words 和 class words 与当前图像密切相关，应当动态合成。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">整体框架包含三个关键模块：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">ESTS：Explicit State Token Synthesis</span></strong><br/><span leaf="">从局部 patch 特征中提取正常/异常原型，并显式注入 state tokens。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">ICTS：Implicit Class Token Sampling</span></strong><br/><span leaf="">用 VAE 建模全局图像语义分布，采样得到更丰富的 class tokens。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">SAGA：Spatially-Aware Glocal Alignment</span></strong><br/><span leaf="">用原型距离引导空间注意力，同时融合全局与局部相似度，提升分类和定位效果。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="CoPS 整体框架" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175328" data-type="jpeg" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.45740740740740743" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=139f6ed8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWicBaoQtjYUeyDRZogvTnVSvDt3Nrnqib2Q28HKZ0iaiaTxqBz1n5sH2miaOq4agc6b4X5SLqF4fBaeVCBYAVqvvY50RUeibIADLnKIw%2F640%3Fwx_fmt%3Djpeg%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">CoPS 整体框架</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">三、ESTS：用“正常/异常原型”替代僵硬的状态词</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">异常检测里的“异常状态”并不是一个单一概念。比如工业缺陷可能是划痕、断裂、凹坑，医学异常可能是肿瘤、息肉、皮损。用一个固定的“damaged”或一组静态 token，很难覆盖这种连续、多样的状态空间。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">CoPS 的 ESTS 模块从图像的局部特征中提取两组原型：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">正常原型：代表正常区域的典型 patch 表示</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">异常原型：代表异常区域的典型 patch 表示</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">具体做法是引入一个 prototype extractor，通过 cross-attention 在局部 patch 特征中聚合代表性信息，生成正常和异常原型。训练时，作者使用 center loss 约束这些原型：正常 patch 应该更靠近正常原型，异常 patch 应该更靠近异常原型。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这样得到的原型会被显式注入到 prompt 的 state token 中。换句话说，模型不再只学习一个抽象的“异常状态”，而是根据当前图像提取出更贴近视觉内容的状态表达。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="ESTS 的原型匹配与 SAGA 的空间注意力" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175326" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5898148148148148" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=9729f079&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8abYr8uWOVDXibBFAG1X634ddziadFSGE2HQdgkGGzZXicnrgzy07PQYqpos8iaLgUeTjs3v2MtEKvKIfjAw96ejTbQI1KeqkGu90%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">ESTS 的原型匹配与 SAGA 的空间注意力</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这个设计有一个很实用的直觉：</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">如果一个 patch 离正常原型很远、离异常原型很近，那么它大概率就是异常区域。</span></code></strong></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">后面的 SAGA 模块也正是利用了这一点。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">四、ICTS：用 VAE 采样补足类别语义</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">除了状态词，类别词同样重要。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">很多零样本异常检测方法为了避免依赖具体类别，会使用类似“object”这样的类无关文本。但问题是，“object”太稀疏了。一个螺丝、一个金属件、一张 CT 图像、一个内窥镜画面，它们的视觉语义差异很大，如果全部压缩成一个泛化标签，模型很容易丢掉类别相关信息。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">CoPS 的 ICTS 模块使用 VAE 对图像全局特征建模：</span></p><ol style="list-style-type: decimal;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">CLIP 视觉编码器提取图像全局特征。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">VAE encoder 将全局特征映射到潜变量分布。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">从潜空间采样多个语义特征。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">VAE decoder 解码得到一组 class token。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">这些采样得到的 class token 被融合进 prompt。</span></p></li></ol><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这相当于给 prompt 增加了一组“语义近邻”表达，让类别词不再是孤零零的固定标签，而是在图像语义附近进行多样化采样。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从实验看，采样数量不是越大越好。作者最终选择 </span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">R=10</span></code><span leaf="">，在准确率和推理速度之间取得了较好的平衡。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">五、SAGA：既看整张图，也看局部异常区域</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">异常检测同时需要两个输出：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">图像级：这张图是否异常？</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">像素级：异常具体在哪里？</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">已有方法常常分别计算全局图像特征和局部 patch 特征与文本 embedding 的相似度，但这种对齐方式可能不够细致。CoPS 的 SAGA 模块做了两件事。</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">第一，用原型距离生成空间权重。</span></strong><br/><span leaf="">前面 ESTS 已经得到正常原型和异常原型。对于每个 patch，模型可以计算它到正常原型、异常原型的距离，并据此生成空间 mask。这个 mask 会强化更可能异常的区域，抑制不相关背景或正常区域。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">第二，融合 global 和 local 信息。</span></strong><br/><span leaf="">图像级异常分数不仅来自全局图像特征，还会结合局部异常响应的最大值。这样能避免模型只依赖全局语义而忽略小缺陷，也能减少纯局部响应带来的误检。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这个设计尤其适合零样本场景：模型没有见过测试类别时，局部原型关系往往比固定类别标签更可靠。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">六、实验结果：13 个工业和医学数据集上达到 SOTA</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">论文在 13 个公开数据集上验证了 CoPS，其中包括：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">工业数据集：MVTec-AD、VisA、BTAD、MPDD、DTD-Synthetic</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">医学数据集：HeadCT、BrainMRI、Br35H、ISIC、ColonDB、ClinicDB、Kvasir、Endo</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">实验采用标准 ZSAD 设置：在一个辅助数据集上训练，在类别不重叠的工业或医学数据集上测试。模型使用 OpenAI CLIP ViT-L/14@336px 作为 backbone，输入图像 resize 到 </span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">518 x 518</span></code><span leaf="">。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">主要结果如下：</span></p><p data-tool="mdnice编辑器" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;overflow-x: auto;"><table style="display: table;text-align: left;"><thead><tr><th style="color: rgb(0, 0, 0);font-size: 16px;line-height: 1.5em;letter-spacing: 0em;text-align: left;font-weight: bold;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(240, 240, 240);height: auto;border-style: solid;border-width: 1px;border-color: rgba(204, 204, 204, 0.4);border-radius: 0px;padding: 5px 10px;min-width: 85px;"><p><span leaf="">指标</span></p></th><th style="color: rgb(0, 0, 0);font-size: 16px;line-height: 1.5em;letter-spacing: 0em;font-weight: bold;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(240, 240, 240);height: auto;border-style: solid;border-width: 1px;border-color: rgba(204, 204, 204, 0.4);border-radius: 0px;padding: 5px 10px;min-width: 85px;text-align: right;"><p><span leaf="">CoPS 平均结果</span></p></th><th style="color: rgb(0, 0, 0);font-size: 16px;line-height: 1.5em;letter-spacing: 0em;font-weight: bold;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgb(240, 240, 240);height: auto;border-style: solid;border-width: 1px;border-color: rgba(204, 204, 204, 0.4);border-radius: 0px;padding: 5px 10px;min-width: 85px;text-align: right;"><p><span leaf="">相比此前最佳方法提升</span></p></th></tr></thead><tbody><tr style="color: rgb(0, 0, 0);background-attachment: scroll;background-clip: border-box;background-color: rgb(255, 255, 255);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;"><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><p><span leaf="">图像级 I-AUROC</span></p></td><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;text-align: right;"><p><span leaf="">92.5%</span></p></td><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;text-align: right;"><p><span leaf="">+1.4%</span></p></td></tr><tr style="color: rgb(0, 0, 0);background-attachment: scroll;background-clip: border-box;background-color: rgb(248, 248, 248);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;"><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><p><span leaf="">图像级 I-AP</span></p></td><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;text-align: right;"><p><span leaf="">94.1%</span></p></td><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;text-align: right;"><p><span leaf="">+1.7%</span></p></td></tr><tr style="color: rgb(0, 0, 0);background-attachment: scroll;background-clip: border-box;background-color: rgb(255, 255, 255);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;"><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><p><span leaf="">像素级 P-AUROC</span></p></td><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;text-align: right;"><p><span leaf="">92.4%</span></p></td><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;text-align: right;"><p><span leaf="">+1.9%</span></p></td></tr><tr style="color: rgb(0, 0, 0);background-attachment: scroll;background-clip: border-box;background-color: rgb(248, 248, 248);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;"><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><p><span leaf="">像素级 P-AP</span></p></td><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;text-align: right;"><p><span leaf="">48.0%</span></p></td><td style="font-size: 14px;padding-top: 5px;padding-right: 10px;padding-bottom: 5px;padding-left: 10px;min-width: 85px;border-top-style: solid;border-bottom-style: solid;border-left-style: solid;border-right-style: solid;border-top-width: 1px;border-bottom-width: 1px;border-left-width: 1px;border-right-width: 1px;border-top-color: rgba(204, 204, 204, 0.4);border-bottom-color: rgba(204, 204, 204, 0.4);border-left-color: rgba(204, 204, 204, 0.4);border-right-color: rgba(204, 204, 204, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;text-align: right;"><p><span leaf="">+4.2%</span></p></td></tr></tbody></table></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从结果可以看到，CoPS 不只提升了图像级分类，也明显增强了像素级异常定位。尤其在医学分割相关数据集上，P-AP 的提升比较突出，说明模型对病灶区域的覆盖和定位更稳定。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="CoPS 与 AdaCLIP、AnomalyCLIP 的定性可视化对比" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175325" data-type="jpeg" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.30092592592592593" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=8d5965f8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGW88tRwqbcMiaTReaXWewkunfG7JgmboGCdao06XdYT2Cibtn5UI3DDYQjWnjf67Ty0btvStqLiclkuulPOE8XibDcx4PT1lBk20yQs%2F640%3Fwx_fmt%3Djpeg%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">CoPS 与 AdaCLIP、AnomalyCLIP 的定性可视化对比</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">上图展示了 CoPS 与 AdaCLIP、AnomalyCLIP 在多个工业和医学数据集上的可视化对比。可以看到：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">在工业场景中，CoPS 对缺陷区域的响应更集中，前景正常区域上的误检更少。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">在医学场景中，CoPS 对病灶区域覆盖更完整，减少了 AnomalyCLIP 中常见的正常区域过激活问题。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这与本文的设计是一致的：原型注入让状态描述更贴近局部视觉模式，类别采样让 prompt 具备更丰富的语义变化，空间感知对齐则进一步把异常响应拉回目标区域。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">七、消融实验：三个模块都有效，ESTS 贡献最大</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">论文还对 ESTS、ICTS、SAGA 三个模块做了系统消融。以完整模型为基准，去掉不同模块都会造成性能下降，其中 ESTS 的影响最大。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作者的实验结论可以概括为：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">单独加入 ESTS、ICTS 或 SAGA，相比基础 prompt learning 框架都有提升。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">ESTS 对图像级和像素级指标的贡献最大，说明正常/异常原型对零样本泛化非常关键。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">ICTS 主要提升 prompt 的语义多样性，尤其有助于图像级分类。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">SAGA 对定位质量帮助明显，通过空间权重减少误检和漏检。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="状态 token 和类别 token 长度的消融" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175331" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.44537037037037036" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=be258494&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibXqjKHdhwhshcCNGiakPo45aIF0ycqv5WQlGBmLnuzicugD6lEsEfaf5CbsdyoFpYIFYQ3hxXe7PuH0PMQb63MIXE3PqiaWUVdIc%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">状态 token 和类别 token 长度的消融</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作者还分析了 token 长度和权重系数的影响。结果显示，状态 token 长度 </span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">M=6</span></code><span leaf="">、类别 token 长度 </span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">N=2</span></code><span leaf=""> 时效果最好。过短会表达不足，过长则可能带来过拟合。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="距离系数和 glocal 系数的消融" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175332" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2722222222222222" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=23b91259&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicBNtzFINxGP1pePP6tSKllxUiat0KFKH4NbfRWBC1N0TRUOODyWSAMKEpxm4Do3uYmuYWcyfvdpqOMBQCm7JKfFndR0RMVTg74%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">距离系数和 glocal 系数的消融</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">SAGA 中的距离系数 </span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">alpha=0.3</span></code><span leaf="">、glocal 系数 </span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">beta=0.9</span></code><span leaf=""> 表现较好。尤其是 </span><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">beta=1.0</span></code><span leaf=""> 时性能下降，说明只依赖全局信息不够，局部异常响应对零样本检测仍然重要。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">八、如何理解 CoPS 的价值？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">CoPS 的价值不只是“又做了一个 prompt learning 方法”，而是把异常检测中的两个核心事实编码进了 prompt 生成过程：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">第一，异常状态是视觉条件化的。</span></strong><br/><span leaf="">不同图像中的异常并不共享一个固定形态，因此 state token 应该参考当前图像的局部视觉结构。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">第二，类别语义不应被过度压缩。</span></strong><br/><span leaf="">用“object”这样的通用标签虽然有利于泛化，但也会造成语义贫乏。通过 VAE 在图像全局语义附近采样，CoPS 在不依赖人工类别模板的情况下补充了类别信息。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从这个角度看，CoPS 实际上是在回答一个更一般的问题：</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">当视觉语言模型进入细粒度异常检测任务时，prompt 应该如何从静态文本变成动态、图像相关的语义接口？</span></code></strong></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这也是本文相对有启发性的地方。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">九、局限与未来方向</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作者也指出，CoPS 目前更擅长检测结构性异常，例如缺陷、破损、病灶区域等。但对于需要高层语义推理的异常，例如物体关系错误、功能异常、复杂逻辑异常，当前框架仍然有限。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这是因为 CoPS 主要依赖 CLIP 特征、局部原型和 prompt 合成，还没有显式建模对象关系与功能语义。未来工作可以结合多模态大模型，引入更强的视觉推理能力，让异常检测从“看出哪里不像正常区域”进一步走向“理解为什么这不合理”。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">总结</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">CoPS 提出了一种面向零样本异常检测的条件化 prompt 合成框架。它不再依赖固定模板或静态可学习 token，而是根据输入图像动态生成状态和类别相关的提示词表示。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">方法上，CoPS 通过 ESTS 提取正常/异常原型，通过 ICTS 采样丰富类别语义，再通过 SAGA 完成空间感知的全局-局部对齐。实验表明，该方法在 13 个工业和医学数据集上取得了 SOTA 表现，尤其在像素级异常定位上提升明显。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">对于工业质检和医学影像这类“异常稀缺、类别开放、形态多变”的场景，CoPS 提供了一个很有代表性的思路：</span><b><code style="font-size: 14px;line-height: 1.8em;letter-spacing: 0em;background-attachment: scroll;background-clip: border-box;background-color: rgba(27, 31, 35, 0.05);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 2px;margin-right: 2px;padding-top: 2px;padding-bottom: 2px;padding-left: 4px;padding-right: 4px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgb(0, 0, 0);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 4px;border-top-right-radius: 4px;border-bottom-right-radius: 4px;border-bottom-left-radius: 4px;overflow-wrap: break-word;font-family: Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(0, 82, 255);"><span leaf="">让 prompt 不再只是写给模型看的句子，而是由图像本身参与生成的动态语义桥梁。</span></code></b></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">本文为粉丝投稿。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175330" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.125" data-w="960" src="https://wechat2rss.xlab.app/img-proxy/?k=0b37f367&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW8tmhlybraJTUVU7JGJDnuYzdyD4YQJ97Hlg4wT4wrQKcicUibzrAVlVRKLWLTCgM1kOJicDV3cWhM2ZpiaMEL4jSmiab3WOLOshkKE%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175329" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7064814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=c98ed4d4&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8gd3lfhbdqtPMgguS0tVtskHib4xYtGuZZtWstx2vUYd02QN9hsDyH4KVibbpdjWKK0av9ia6MbdEIf87VTpSKk7aBwCsicKyt9yw%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=d0904369&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247658981%26idx%3D1%26sn%3D3165acaf62ea85b7acdf567d48b1df33">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Thu, 23 Apr 2026 19:08:00 +0800</pubDate>
    </item>
    <item>
      <title>强烈推荐！即插即用模块顶会新成果！CVPR/ICLR等高分作品，这波思路必须学！</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247658919&amp;idx=1&amp;sn=c8fdf78f2276081531323dea6a97fbdc</link>
      <description>今天给大家推荐一个深度学习创新利器：即插即用的模块。它们都有标准化接口、可以无缝嵌入现有模型架构中。</description>
      <content:encoded><![CDATA[<p><span>我爱计算机视觉</span> <span>2026-04-22 14:40</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=c66dd617&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGWibE3ID5eLRawOulZFByibI5I5z7HGicriaamYYX6WKAJ9SRutMcL8MMzM3vjKpwReucrfmVYmj8EnyN3YAEmjUNTIPj43WLAibaDhI%2F0%3Fwx_fmt%3Djpeg"/></p>
  
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 10px;padding-right: 10px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: Optima, &#34;Microsoft YaHei&#34;, PingFangSC-regular, serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;" data-pm-slice="0 0 []"><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span><span leaf="">今天给大家推荐一个深度学习创新利器：<span textstyle="" style="font-weight: bold;">即插即用的模块</span>。</span></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span leaf="">它们都有标准化接口、可以无缝嵌入现有模型架构中。能够让你在不推翻整个baseline的情况下，就可以针对某一方面的短板进行针对性优化，从而 高效涨点。同时，由于只改动了局部，变量可控，效果也更容易通过对比实验和消融实验进行验证，更是容易让审稿人看到自己的贡献。</span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span><span leaf="">为了让大家用起来更方便，节省自己的时间，我给大家对</span><span style="font-weight: bold;" leaf="">CVPR、ICLR、NeurIPS、AAAI等顶会上最新的、代码可复现的模块，</span><span textstyle="" style=""><span leaf="">进行了系统整理，</span></span><span leaf=""><span textstyle="" style="font-weight: bold;">共306个</span>。既有注意力机制、卷积、特征融合、特征提取等各种任务通用的，也有针对目标检测、时间序列、AI+医学等特定任务场景的。你可以根据自己的需要，快速落地到自己的文章里。</span></span></p><p style="text-align: center;"><span leaf=""><img class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-aistatus="1" data-imgfileid="100006877" data-ratio="1.7055555555555555" data-s="300,640" data-type="png" data-w="1080" style="height: auto !important;" type="block" src="https://wechat2rss.xlab.app/img-proxy/?k=e2c89c55&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2F7Qz2icvnllkHRaJWYI1WDVT1tPP2UnwWvhWxlnHhl184VM6VRC1cVLLg1QKQIhFK18B4tSnCEcMibY8Y06Wnne2sNGqRzWuELq34Cn27ZXy1w%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D0"/></span></p><div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" data-pm-slice="0 0 []" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px 10px;outline: 0px;max-width: 100%;overflow-wrap: break-word;color: rgb(0, 0, 0);font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;-webkit-text-stroke-width: 0px;white-space: normal;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;width: auto;visibility: visible;box-sizing: border-box !important;"><p data-tool="mdnice编辑器" data-pm-slice="0 0 []" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 8px 0px;outline: 0px;max-width: 100%;clear: both;min-height: 1em;color: rgb(0, 0, 0);font-variant-ligatures: normal;font-variant-caps: normal;orphans: 2;text-indent: 0em;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;line-height: 1.8em;text-align: center;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;visibility: visible;"><span leaf=""><span textstyle="" style="color: rgb(255, 218, 81);">扫描</span>下方二维码，回复「</span></span><span><span leaf=""><span textstyle="" style="font-weight: bold;">306模块</span></span></span><span leaf="" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;visibility: visible;">」</span></p><p data-tool="mdnice编辑器" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 8px 0px;outline: 0px;max-width: 100%;clear: both;min-height: 1em;color: rgb(0, 0, 0);font-variant-ligatures: normal;font-variant-caps: normal;orphans: 2;text-indent: 0em;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;line-height: 1.8em;text-align: center;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;visibility: visible;"><span leaf="">免费获取<span textstyle="" style="font-weight: bold;text-decoration: underline;">全部论文合集及项目代码</span></span></span></p><figure data-tool="mdnice编辑器" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 10px 0px;padding: 0px;outline: 0px;max-width: 100%;color: rgb(0, 0, 0);font-variant-ligatures: normal;font-variant-caps: normal;letter-spacing: normal;orphans: 2;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;display: flex;flex-direction: column;justify-content: center;align-items: center;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"></figure></div><p style="text-align: center;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-croporisrc="https://mmbiz.qpic.cn/mmbiz_jpg/P9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c/0?wx_fmt=webp&amp;from=appmsg" data-cropselx2="208" data-cropsely2="208" data-imgfileid="100173703" data-ratio="1" data-s="300,640" data-type="webp" data-w="800" style="width: 208px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=2bbd5f43&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c%2F640%3Fwx_fmt%3Dwebp%26from%3Dappmsg"/></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span><span leaf=""><span textstyle="" style="color: rgb(172, 57, 255);font-weight: bold;">通用的即插即用模块</span></span></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span style="background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);font-family: Optima, &#34;Microsoft YaHei&#34;, PingFangSC-regular, serif;word-spacing: 0em;word-break: break-word;overflow-wrap: break-word;color: rgb(0, 0, 0);"><span leaf=""><span textstyle="" style="font-size: 18px;font-weight: bold;">【CVPR26】MixerCSeg: An Efficient Mixer </span></span></span><span style="background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);font-family: Optima, &#34;Microsoft YaHei&#34;, PingFangSC-regular, serif;word-spacing: 0em;word-break: break-word;overflow-wrap: break-word;color: rgb(0, 0, 0);"><span leaf=""><span textstyle="" style="font-size: 18px;font-weight: bold;">Archite</span></span></span><span style="background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);font-family: Optima, &#34;Microsoft YaHei&#34;, PingFangSC-regular, serif;word-spacing: 0em;word-break: break-word;overflow-wrap: break-word;color: rgb(0, 0, 0);"><span leaf=""><span textstyle="" style="font-size: 18px;font-weight: bold;">cture for Crack Segmentation via Decoupled Mamba Attention</span></span></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span style="background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);font-family: Optima, &#34;Microsoft YaHei&#34;, PingFangSC-regular, serif;word-spacing: 0em;word-break: break-word;overflow-wrap: break-word;color: rgb(0, 0, 0);"><span leaf=""><span textstyle="" style="color: rgb(172, 57, 255);font-weight: bold;">内容：</span></span></span><span leaf="">该论文为CVPR 2026工作，提出轻量级裂缝分割模型MixerCSeg，融合 CNN 局部纹理捕捉、Transformer 全局依赖建模与解耦 Mamba 注意力，搭配方向引导门控卷积与空间细化多尺度融合模块，在多裂缝数据集上实现 SOTA 精度，且仅 2.54M 参数、2.05GFLOPs，兼顾高效与复杂场景鲁棒性。</span></p><p style="text-align: center;"><span leaf=""><img class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-aistatus="1" data-imgfileid="100006879" data-ratio="0.5038461538461538" data-s="300,640" data-type="png" data-w="1040" style="width: 501px;height: auto !important;" type="block" src="https://wechat2rss.xlab.app/img-proxy/?k=35831c1c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2F7Qz2icvnllkHYLbBKOM9hxEXp3T3ucia4eq5TP0tk9kPlDRCF9W4ud6ic3TTugjibdzA5siar07LEYG00BRPV2oXgdvAmjFuDtAVicvianibl0TNRQk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D2"/></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span><span leaf=""><span textstyle="" style="font-size: 18px;font-weight: bold;">【CVPR26】It Takes Two: A Duet of Periodicity and Directionality for Burst Flicker Removal</span></span></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span style="background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);font-family: Optima, &#34;Microsoft YaHei&#34;, PingFangSC-regular, serif;word-spacing: 0em;word-break: break-word;overflow-wrap: break-word;color: rgb(0, 0, 0);"><span leaf=""><span textstyle="" style="color: rgb(172, 57, 255);font-weight: bold;">内容：</span></span></span><span leaf="">这篇论文聚焦手机/相机在室内光源下拍照出现的条纹闪烁去除问题，提出基于 Transformer 的Flickerformer框架，通过相位融合模块、自相关前馈网络、小波方向注意模块三大核心组件，联合建模闪烁的周期性与方向性，在连拍图像去闪烁任务中实现更优画质恢复与更低参数量，可有效消除明暗条纹并保留图像细节。</span></p><p style="text-align: center;"><span leaf=""><img class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-aistatus="1" data-imgfileid="100006880" data-ratio="0.3712962962962963" data-s="300,640" data-type="png" data-w="1080" style="width: 489px;height: auto !important;" type="block" src="https://wechat2rss.xlab.app/img-proxy/?k=5d0641cc&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2F7Qz2icvnllkH6HQGtwUYYdKich0kkxEdE2E34JOxia9zthd5yh1k5T3skBVcicIn2ZJmkgxJaMFwBEWDDjXD2EJ66xHnL05kRysG1BleWD5TBVY%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D3"/></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span><span leaf=""><span textstyle="" style="font-size: 18px;font-weight: bold;">【AAAI26】Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection</span></span></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span style="background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);font-family: Optima, &#34;Microsoft YaHei&#34;, PingFangSC-regular, serif;word-spacing: 0em;word-break: break-word;overflow-wrap: break-word;color: rgb(0, 0, 0);"><span leaf=""><span textstyle="" style="color: rgb(172, 57, 255);font-weight: bold;">内容：</span></span></span><span leaf="">这篇论文提出面向遥感目标检测的Strip R‑CNN，针对遥感图像中高长宽比细长目标检测难的问题，创新采用正交大条状卷积构建轻量高效的 StripNet 主干，通过序列式横竖长条卷积高效捕捉长程空间特征，并设计解耦的 Strip 检测头强化定位分支，有效提升细长目标定位与角度回归精度，模型仅约 30M 参数，在 DOTA‑v1.0、FAIR1M、HRSC2016、DIOR‑R 等多个遥感检测基准上取得 SOTA 性能，其中 DOTA‑v1.0 数据集上达 82.75% mAP，兼顾效率与精度。</span></p><p style="text-align: center;"><span leaf=""><img class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-aistatus="1" data-imgfileid="100006881" data-ratio="0.5697050938337802" data-s="300,640" data-type="png" data-w="746" style="width: 514px;height: auto !important;" type="block" src="https://wechat2rss.xlab.app/img-proxy/?k=bfc83ede&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2F7Qz2icvnllkESZFhEqn06V6NUl7T56CdRhoRoc4ibLx4hpR1mbdd2Tt00GmoBr4mNwS5hkNOFw9pOial8UVJF2DxZORoNS2WyU3GIPafm9SmH4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D4"/></span></p><div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin: 0px;padding: 0px 10px;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);width: auto;color: rgb(0, 0, 0);overflow-wrap: break-word;" data-pm-slice="4 2 []"><div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" data-pm-slice="0 0 []" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px 10px;outline: 0px;max-width: 100%;overflow-wrap: break-word;color: rgb(0, 0, 0);font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;-webkit-text-stroke-width: 0px;white-space: normal;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;width: auto;visibility: visible;box-sizing: border-box !important;"><p data-tool="mdnice编辑器" data-pm-slice="0 0 []" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 8px 0px;outline: 0px;max-width: 100%;clear: both;min-height: 1em;color: rgb(0, 0, 0);font-variant-ligatures: normal;font-variant-caps: normal;orphans: 2;text-indent: 0em;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;line-height: 1.8em;text-align: center;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;visibility: visible;"><span leaf=""><span textstyle="" style="color: rgb(255, 218, 81);">扫描</span>下方二维码，回复「</span></span><span><span leaf=""><span textstyle="" style="font-weight: bold;">306模块</span></span></span><span leaf="" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;visibility: visible;">」</span></p><p data-tool="mdnice编辑器" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 8px 0px;outline: 0px;max-width: 100%;clear: both;min-height: 1em;color: rgb(0, 0, 0);font-variant-ligatures: normal;font-variant-caps: normal;orphans: 2;text-indent: 0em;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;line-height: 1.8em;text-align: center;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;visibility: visible;"><span leaf="">免费获取<span textstyle="" style="font-weight: bold;text-decoration: underline;">全部论文合集及项目代码</span></span></span></p><figure data-tool="mdnice编辑器" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 10px 0px;padding: 0px;outline: 0px;max-width: 100%;color: rgb(0, 0, 0);font-variant-ligatures: normal;font-variant-caps: normal;letter-spacing: normal;orphans: 2;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;display: flex;flex-direction: column;justify-content: center;align-items: center;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"></figure></div><p style="text-align: center;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-croporisrc="https://mmbiz.qpic.cn/mmbiz_jpg/P9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c/0?wx_fmt=webp&amp;from=appmsg" data-cropselx2="208" data-cropsely2="208" data-imgfileid="100173703" data-ratio="1" data-s="300,640" data-type="webp" data-w="800" style="width: 208px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=2bbd5f43&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c%2F640%3Fwx_fmt%3Dwebp%26from%3Dappmsg"/></span></p></div><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span><span leaf=""><span textstyle="" style="color: rgb(172, 57, 255);font-weight: bold;">针对特定任务场景</span></span></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span><span leaf=""><span textstyle="" style="font-size: 18px;font-weight: bold;">【ICLR26  时序】CORA: COVARIATE-AWARE ADAPTATION OF TIME SERIES FOUNDATION MODELS</span></span></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span style="background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);font-family: Optima, &#34;Microsoft YaHei&#34;, PingFangSC-regular, serif;word-spacing: 0em;word-break: break-word;overflow-wrap: break-word;color: rgb(0, 0, 0);"><span leaf=""><span textstyle="" style="color: rgb(172, 57, 255);font-weight: bold;">内容：</span></span></span><span leaf="">论文提出面向时序基础模型（TSFMs）的协变量感知适配框架 CORA，无需改动预训练模型，通过格兰杰因果嵌入量化协变量影响力、结合零初始化条件注入实现多模态协变量渐进融合，在时序预测任务中泛化性与可解释性更优，适配多种主流时序基础模型架构。</span></p><p style="text-align: center;"><span leaf=""><img class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-aistatus="1" data-imgfileid="100006882" data-ratio="0.43033175355450237" data-s="300,640" data-type="png" data-w="1055" style="width: 506px;height: auto !important;" type="block" src="https://wechat2rss.xlab.app/img-proxy/?k=2c32375f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2F7Qz2icvnllkEQsib3yDicXVh61P7bH60YXmxNsoiciawRukGvP5aeoOB8oC4YgAFSS4rhWjjdGicVicaNBSf4y9VUOLIiclhVozBE6iaibqWlX22UFeC4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D6"/></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span><span leaf=""><span textstyle="" style="font-size: 18px;font-weight: bold;">【ACM MM 图像分割】CRISP-SAM2 : SAM2 with Cross-Modal Interaction and Semantic  Prompting for Multi-Organ Segmentation</span></span></span></p><p data-tool="mdnice编辑器" style="color: rgb(0, 0, 0);line-height: 1.8em;text-indent: 0em;margin: 0px;padding: 8px 0px;"><span style="background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);font-family: Optima, &#34;Microsoft YaHei&#34;, PingFangSC-regular, serif;word-spacing: 0em;word-break: break-word;overflow-wrap: break-word;color: rgb(0, 0, 0);"><span leaf=""><span textstyle="" style="color: rgb(172, 57, 255);font-weight: bold;">内容：</span></span></span><span leaf="">该论文基于 SAM2 构建面向医学多器官分割的 CRISP-SAM2 模型，针对原生 SAM2 依赖人工几何提示、医学影像细节分割不准、空间信息易丢失等问题，采用渐进式交叉注意力跨模态交互融合器官文本语义与图像视觉特征并注入图像编码器，同时改用语义提示机制替代传统几何提示，搭配记忆相似度排序自更新与掩码精细化模块适配医学序列影像，在 7 项公开腹部 CT/MRI 多器官数据集上实验证明，该模型在 DSC、NSD 指标上全面超越 SAM、MedSAM 等主流医学分割算法，有效提升复杂器官边界分割精度，实现文本语义引导、低交互、高精度的医学多器官自动分割。</span></p><p style="text-align: center;"><span leaf=""><img class="rich_pages wxw-img js_img_placeholder wx_img_placeholder" data-aistatus="1" data-imgfileid="100006883" data-ratio="0.34444444444444444" data-s="300,640" data-type="png" data-w="1080" style="width: 510px;height: auto !important;" type="block" src="https://wechat2rss.xlab.app/img-proxy/?k=23350099&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2F7Qz2icvnllkG7eHib0WhAzgLZc527TS0iaxN2OwIaXJuuZAoXC3n6vwk78QjXSTA8kFsOiaYmwicrcBA6WA0hl5U4d92c6oaZegLxHRibgK1fxVFA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg%26watermark%3D1%23imgIndex%3D7"/></span></p><div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin: 0px;padding: 0px 10px;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);width: auto;color: rgb(0, 0, 0);overflow-wrap: break-word;" data-pm-slice="4 2 []"><div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" data-pm-slice="0 0 []" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px 10px;outline: 0px;max-width: 100%;overflow-wrap: break-word;color: rgb(0, 0, 0);font-style: normal;font-variant-ligatures: normal;font-variant-caps: normal;font-weight: 400;orphans: 2;text-indent: 0px;text-transform: none;widows: 2;-webkit-text-stroke-width: 0px;white-space: normal;background: none 0% 0% / auto no-repeat scroll padding-box border-box rgba(0, 0, 0, 0);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;width: auto;visibility: visible;box-sizing: border-box !important;"><p data-tool="mdnice编辑器" data-pm-slice="0 0 []" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 8px 0px;outline: 0px;max-width: 100%;clear: both;min-height: 1em;color: rgb(0, 0, 0);font-variant-ligatures: normal;font-variant-caps: normal;orphans: 2;text-indent: 0em;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;line-height: 1.8em;text-align: center;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;visibility: visible;"><span leaf=""><span textstyle="" style="color: rgb(255, 218, 81);">扫描</span>下方二维码，回复「</span></span><span><span leaf=""><span textstyle="" style="font-weight: bold;">306模块</span></span></span><span leaf="" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;visibility: visible;">」</span></p><p data-tool="mdnice编辑器" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 8px 0px;outline: 0px;max-width: 100%;clear: both;min-height: 1em;color: rgb(0, 0, 0);font-variant-ligatures: normal;font-variant-caps: normal;orphans: 2;text-indent: 0em;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;line-height: 1.8em;text-align: center;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 0px;padding: 0px;outline: 0px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;visibility: visible;"><span leaf="">免费获取<span textstyle="" style="font-weight: bold;text-decoration: underline;">全部论文合集及项目代码</span></span></span></p><figure data-tool="mdnice编辑器" style="-webkit-tap-highlight-color: rgba(0, 0, 0, 0);margin: 10px 0px;padding: 0px;outline: 0px;max-width: 100%;color: rgb(0, 0, 0);font-variant-ligatures: normal;font-variant-caps: normal;letter-spacing: normal;orphans: 2;widows: 2;word-spacing: 0px;-webkit-text-stroke-width: 0px;background-color: rgb(255, 255, 255);text-decoration-thickness: initial;text-decoration-style: initial;text-decoration-color: initial;display: flex;flex-direction: column;justify-content: center;align-items: center;visibility: visible;box-sizing: border-box !important;overflow-wrap: break-word !important;"></figure></div><p style="text-align: center;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-croporisrc="https://mmbiz.qpic.cn/mmbiz_jpg/P9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c/0?wx_fmt=webp&amp;from=appmsg" data-cropselx2="208" data-cropsely2="208" data-imgfileid="100173703" data-ratio="1" data-s="300,640" data-type="webp" data-w="800" style="width: 208px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=2bbd5f43&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FP9MWBRYIGWicoGQ62piaFfDXibOOleHszSJicDFHVIFQ1PZw1My56lghdrzvOByI1JicRECFABTzIPLlLYnvv3K2lMlK6D0d8QmT82fibG4EwJt7c%2F640%3Fwx_fmt%3Dwebp%26from%3Dappmsg"/></span></p></div></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=36e98aab&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247658919%26idx%3D1%26sn%3Dc8fdf78f2276081531323dea6a97fbdc">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Wed, 22 Apr 2026 14:40:00 +0800</pubDate>
    </item>
    <item>
      <title>ACL 2026 | 耶鲁等提出SAM3-I：无需Agent，让SAM家族直接听懂复杂指令！</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247658916&amp;idx=1&amp;sn=d8d060efbb6ca621d36b62fcdd2a5163</link>
      <description></description>
      <content:encoded><![CDATA[<p>原创 <span>CV君</span> <span>2026-04-21 15:02</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=d88fd9a9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGW8skPoInHo2jic3TQj80s3HlbDRgqugpoDwT9sbSTH4EZSp9JjC9G4ribTPuQeLQgiaEMWlGrX0w6l7H2xALLMickIGxsbrggQKrOU%2F0%3Fwx_fmt%3Djpeg"/></p>
  
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175238" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.2778649921507064" data-w="637" src="https://wechat2rss.xlab.app/img-proxy/?k=b2fb19aa&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGWib2CUe0KricQPQhT5kSvenWr142PN4W6v74WD2S2pMrribujzKF09h9UjICVgzxww7lQLgy334CibRJKAGTh3R7XJK78Q2uzlDtKI%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">说起计算机视觉领域的“全能选手”，Meta 发布的 SAM（Segment Anything Model）家族绝对是绕不开的话题。从最初依靠点、框提示的 SAM，到支持视频追踪的 SAM 2，再到引入“概念提示”的 SAM3，这个家族一直在进步。然而，尽管 SAM3 已经能听懂像“足球运动员”这样的短语，但面对“那个穿着蓝色球衣、正在草地上铲球的运动员”这种复杂的自然语言指令时，它还是显得有些力不从心，往往需要外接一个大模型（Agent）来当“翻译官”。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了打破这种局限，来自阿尔伯塔大学、微信、美国西北大学、南方科技大学、耶鲁大学、中科院等机构的研究者们，共同推出了 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">SAM3-I</span></strong><span leaf="">，它定义了</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">提示性指令分割（Promptable Instruction Segmentation, PIS）</span></strong><span leaf="">任务，不再需要外部 Agent 的繁琐中转，而是通过一套精巧的级联适配器机制，让模型直接具备了从简单描述到复杂推理的“听令”能力。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175237" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.30462962962962964" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=749c8851&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicXX6yAEMnBV83iaLkf4d8MPKMNduDHVj2QmR21IhyBEZt8h0jo0EtiadhOqnEuwbS6P2q2lOtFD1zOx9w8k5X8hN8UD3AFRicR08%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2512.04585" target="_blank">https://arxiv.org/abs/2512.04585</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">机构</span></b><span leaf="">: 阿尔伯塔大学、腾讯微信、美国西北大学、南方科技大学、耶鲁大学、乌得勒支大学、大连理工大学、中国科学院深圳先进技术研究院</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">代码仓库</span></b><span leaf="">: <a href="https://github.com/debby-0527/SAM3-I" target="_blank">https://github.com/debby-0527/SAM3-I</a> (已开源)</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">录用会议</span></b><span leaf="">: ACL 2026</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">进化：从“识词”到“听令”</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在 SAM 家族的演进史中，交互方式的变革一直是核心。早期的 SAM 1 和 SAM 2 依赖视觉提示，你点哪里，它分哪里。到了 SAM3，引入了</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">提示性概念分割（Promptable Concept Segmentation, PCS）</span></strong><span leaf="">，你输入一个名词短语（NP），它能找出图中所有的对应实例。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="SAM家族分割范式的演进：从视觉提示到概念提示，再到指令提示" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175241" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.475" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=c3827aa1&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWicC0N3zI0rVFxRG7A2U6AvibKYhMFic4G48gHsReIzH7QqLJicDabOV2m6YAxeL4Z7L8Fy9JQkmImIbR5VxhLVibDp4SIx7W9GyiaeQ%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">SAM家族分割范式的演进：从视觉提示到概念提示，再到指令提示</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">但在实际应用中，我们更习惯用丰富的语言来描述目标，比如“靠右边那个正在滑板的人”。目前的 SAM3 面对这种需求，通常需要调用一个外部的多模态大模型（如 Qwen3-VL）作为 Agent，先将长指令简化为短名词，再进行多轮掩码过滤。这种做法不仅系统复杂、开销大，而且在“翻译”过程中往往会丢失关键的细节信息，导致分割结果过于粗糙。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="SAM3-I与传统Agent方案的对比：SAM3-I 实现了单次推理直接输出" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175239" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.3685185185185185" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=6a7a81de&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9hKdcy1ktaSkkQYK9LnJ1VPncic4ZBwHhhDLSQRf3v2BiaPhBbjx5uDUyB42lXDLJj0vWYbCrgxpQFGehM98FAwZwt25zMicU1xs%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">SAM3-I与传统Agent方案的对比：SAM3-I 实现了单次推理直接输出</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">SAM3-I 的出现，正是为了终结这种“中间商赚差价”的模式。它将概念理解与指令推理统一到了一个框架内，实现了单次推理（Single-pass）即可直接输出结果，既保留了 SAM3 强大的概念召回能力，又赋予了它理解自由格式自然语言指令的灵性。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">方法详解：级联适配器与分布对齐</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">SAM3-I 的核心挑战在于：如何在不破坏 SAM3 原有预训练知识的前提下，注入复杂的指令遵循能力？作者提出了一种</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">指令感知级联适配器（Instruction-Aware Cascaded Adapter）</span></strong><span leaf="">机制。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="SAM3-I 框架概览：在冻结的骨干网络中注入级联适配器" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175240" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.5074074074074074" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=756e75bb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW8L6JEy0ibK4jrhic9tf3ricm53QQ4gfRJN7gbgHtsibWUJ4qNVWEiahn1YxF6ic8cNF2jQI5VE6h9GxUpbGhzWZO4gVy4DEIqb5vhsE%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">SAM3-I 框架概览：在冻结的骨干网络中注入级联适配器</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 级联适配器设计</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">SAM3-I 的 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Input</span></strong><span leaf=""> 是原始图像和一段自然语言指令，</span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">Output</span></strong><span leaf=""> 则是对应的分割掩码。为了处理不同复杂度的语言，模型在冻结的 SAM3 文本编码器和检测器中插入了两层适配器：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">S-Adapter（简单适配器）</span></b><span leaf="">：专门学习属性、位置和空间关系。当指令中包含明确的目标名词（如“红色的杯子”）时，它负责将这些显式锚点与视觉证据对齐。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">C-Adapter（复杂适配器）</span></b><span leaf="">：它构建在 S-Adapter 之上，形成级联结构。它专门负责处理那些不含明确名词、需要功能或动作推理的指令（如“用来解渴的东西”）。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">每个适配器都采用了瓶颈结构（下采样投影、GELU 激活、上采样投影），并引入了多头自注意力（MHSA）机制来捕捉长距离的文本依赖。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 四大分布对齐损失</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了确保模型在不同层级的指令下都能保持一致的理解，作者设计了四种分布对齐损失：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">指令对比损失 (</span><span style="cursor:pointer;" data-formula="\mathcal{L}_{\text{inst}}"><span data-formula="\mathcal{L}_{\text{inst}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 1883.4 862.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 4.261ex;height: 1.952ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="69" d="M69 609Q69 637 87 653T131 669Q154 667 171 652T188 609Q188 579 171 564T129 549Q104 549 87 564T69 609ZM247 0Q232 3 143 3Q132 3 106 3T56 1L34 0H26V46H42Q70 46 91 49Q100 53 102 60T104 102V205V293Q104 345 102 359T88 378Q74 385 41 385H30V408Q30 431 32 431L42 432Q52 433 70 434T106 436Q123 437 142 438T171 441T182 442H185V62Q190 52 197 50T232 46H255V0H247Z"></path><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(278, 0)"></path><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z" transform="translate(834, 0)"></path><path data-c="74" d="M27 422Q80 426 109 478T141 600V615H181V431H316V385H181V241Q182 116 182 100T189 68Q203 29 238 29Q282 29 292 100Q293 108 293 146V181H333V146V134Q333 57 291 17Q264 -10 221 -10Q187 -10 162 2T124 33T105 68T98 100Q97 107 97 248V385H18V422H27Z" transform="translate(1228, 0)"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">)</span></b><span leaf="">：确保描述同一个目标的简单指令和复杂指令在语义空间中靠得更近，增强对不同表达方式的不变性。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">父级概念锚定损失 (</span><span style="cursor:pointer;" data-formula="\mathcal{L}_{\text{anchor}}"><span data-formula="\mathcal{L}_{\text{anchor}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 2824.6 862.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 6.39ex;height: 1.952ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z"></path><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(500, 0)"></path><path data-c="63" d="M370 305T349 305T313 320T297 358Q297 381 312 396Q317 401 317 402T307 404Q281 408 258 408Q209 408 178 376Q131 329 131 219Q131 137 162 90Q203 29 272 29Q313 29 338 55T374 117Q376 125 379 127T395 129H409Q415 123 415 120Q415 116 411 104T395 71T366 33T318 2T249 -11Q163 -11 99 53T34 214Q34 318 99 383T250 448T370 421T404 357Q404 334 387 320Z" transform="translate(1056, 0)"></path><path data-c="68" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 124T102 167T103 217T103 272T103 329Q103 366 103 407T103 482T102 542T102 586T102 603Q99 622 88 628T43 637H25V660Q25 683 27 683L37 684Q47 685 66 686T103 688Q120 689 140 690T170 693T181 694H184V367Q244 442 328 442Q451 442 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(1500, 0)"></path><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z" transform="translate(2056, 0)"></path><path data-c="72" d="M36 46H50Q89 46 97 60V68Q97 77 97 91T98 122T98 161T98 203Q98 234 98 269T98 328L97 351Q94 370 83 376T38 385H20V408Q20 431 22 431L32 432Q42 433 60 434T96 436Q112 437 131 438T160 441T171 442H174V373Q213 441 271 441H277Q322 441 343 419T364 373Q364 352 351 337T313 322Q288 322 276 338T263 372Q263 381 265 388T270 400T273 405Q271 407 250 401Q234 393 226 386Q179 341 179 207V154Q179 141 179 127T179 101T180 81T180 66V61Q181 59 183 57T188 54T193 51T200 49T207 48T216 47T225 47T235 46T245 46H276V0H267Q249 3 140 3Q37 3 28 0H20V46H36Z" transform="translate(2556, 0)"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">)</span></b><span leaf="">：这是一个非常巧妙的设计。它要求指令的嵌入向量不能脱离其所属的“概念”范畴。其公式为：</span><span style="display: block;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;text-align: center;cursor: pointer;"><p data-formula="{\mathcal{L}_{\text{anchor}} = \sum_i \max \left( 0, m + \max_{j: y_j \neq y_i} \langle z_i^{sc}, z_j^{o} \rangle - \langle z_i^{sc}, z_i^{o} \rangle \right)}
" style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;font-weight: normal;text-align: center;overflow-x: auto;overflow-y: auto;display: block;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -1449.5 22016.4 2641.7" aria-hidden="true" style="max-width: 300%;vertical-align: -2.697ex;width: 49.811ex;height: 5.977ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z"></path><path data-c="6E" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q450 438 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(500, 0)"></path><path data-c="63" d="M370 305T349 305T313 320T297 358Q297 381 312 396Q317 401 317 402T307 404Q281 408 258 408Q209 408 178 376Q131 329 131 219Q131 137 162 90Q203 29 272 29Q313 29 338 55T374 117Q376 125 379 127T395 129H409Q415 123 415 120Q415 116 411 104T395 71T366 33T318 2T249 -11Q163 -11 99 53T34 214Q34 318 99 383T250 448T370 421T404 357Q404 334 387 320Z" transform="translate(1056, 0)"></path><path data-c="68" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 124T102 167T103 217T103 272T103 329Q103 366 103 407T103 482T102 542T102 586T102 603Q99 622 88 628T43 637H25V660Q25 683 27 683L37 684Q47 685 66 686T103 688Q120 689 140 690T170 693T181 694H184V367Q244 442 328 442Q451 442 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z" transform="translate(1500, 0)"></path><path data-c="6F" d="M28 214Q28 309 93 378T250 448Q340 448 405 380T471 215Q471 120 407 55T250 -10Q153 -10 91 57T28 214ZM250 30Q372 30 372 193V225V250Q372 272 371 288T364 326T348 362T317 390T268 410Q263 411 252 411Q222 411 195 399Q152 377 139 338T126 246V226Q126 130 145 91Q177 30 250 30Z" transform="translate(2056, 0)"></path><path data-c="72" d="M36 46H50Q89 46 97 60V68Q97 77 97 91T98 122T98 161T98 203Q98 234 98 269T98 328L97 351Q94 370 83 376T38 385H20V408Q20 431 22 431L32 432Q42 433 60 434T96 436Q112 437 131 438T160 441T171 442H174V373Q213 441 271 441H277Q322 441 343 419T364 373Q364 352 351 337T313 322Q288 322 276 338T263 372Q263 381 265 388T270 400T273 405Q271 407 250 401Q234 393 226 386Q179 341 179 207V154Q179 141 179 127T179 101T180 81T180 66V61Q181 59 183 57T188 54T193 51T200 49T207 48T216 47T225 47T235 46T245 46H276V0H267Q249 3 140 3Q37 3 28 0H20V46H36Z" transform="translate(2556, 0)"></path></g></g></g><g data-mml-node="mo" transform="translate(3102.3, 0)"><path data-c="3D" d="M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z"></path></g><g data-mml-node="munder" transform="translate(4158.1, 0)"><g data-mml-node="mo"><path data-c="2211" d="M60 948Q63 950 665 950H1267L1325 815Q1384 677 1388 669H1348L1341 683Q1320 724 1285 761Q1235 809 1174 838T1033 881T882 898T699 902H574H543H251L259 891Q722 258 724 252Q725 250 724 246Q721 243 460 -56L196 -356Q196 -357 407 -357Q459 -357 548 -357T676 -358Q812 -358 896 -353T1063 -332T1204 -283T1307 -196Q1328 -170 1348 -124H1388Q1388 -125 1381 -145T1356 -210T1325 -294L1267 -449L666 -450Q64 -450 61 -448Q55 -446 55 -439Q55 -437 57 -433L590 177Q590 178 557 222T452 366T322 544L56 909L55 924Q55 945 60 948Z"></path></g><g data-mml-node="mi" transform="translate(600, -1084.4) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(5768.8, 0)"><path data-c="6D" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q351 442 364 440T387 434T406 426T421 417T432 406T441 395T448 384T452 374T455 366L457 361L460 365Q463 369 466 373T475 384T488 397T503 410T523 422T546 432T572 439T603 442Q729 442 740 329Q741 322 741 190V104Q741 66 743 59T754 49Q775 46 803 46H819V0H811L788 1Q764 2 737 2T699 3Q596 3 587 0H579V46H595Q656 46 656 62Q657 64 657 200Q656 335 655 343Q649 371 635 385T611 402T585 404Q540 404 506 370Q479 343 472 315T464 232V168V108Q464 78 465 68T468 55T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z" transform="translate(833, 0)"></path><path data-c="78" d="M201 0Q189 3 102 3Q26 3 17 0H11V46H25Q48 47 67 52T96 61T121 78T139 96T160 122T180 150L226 210L168 288Q159 301 149 315T133 336T122 351T113 363T107 370T100 376T94 379T88 381T80 383Q74 383 44 385H16V431H23Q59 429 126 429Q219 429 229 431H237V385Q201 381 201 369Q201 367 211 353T239 315T268 274L272 270L297 304Q329 345 329 358Q329 364 327 369T322 376T317 380T310 384L307 385H302V431H309Q324 428 408 428Q487 428 493 431H499V385H492Q443 385 411 368Q394 360 377 341T312 257L296 236L358 151Q424 61 429 57T446 50Q464 46 499 46H516V0H510H502Q494 1 482 1T457 2T432 2T414 3Q403 3 377 3T327 1L304 0H295V46H298Q309 46 320 51T331 63Q331 65 291 120L250 175Q249 174 219 133T185 88Q181 83 181 74Q181 63 188 55T206 46Q208 46 208 23V0H201Z" transform="translate(1333, 0)"></path></g><g data-mml-node="mrow" transform="translate(7629.8, 0)"><g data-mml-node="mo"><path data-c="28" d="M701 -940Q701 -943 695 -949H664Q662 -947 636 -922T591 -879T537 -818T475 -737T412 -636T350 -511T295 -362T250 -186T221 17T209 251Q209 962 573 1361Q596 1386 616 1405T649 1437T664 1450H695Q701 1444 701 1441Q701 1436 681 1415T629 1356T557 1261T476 1118T400 927T340 675T308 359Q306 321 306 250Q306 -139 400 -430T690 -924Q701 -936 701 -940Z"></path></g><g data-mml-node="mn" transform="translate(736, 0)"><path data-c="30" d="M96 585Q152 666 249 666Q297 666 345 640T423 548Q460 465 460 320Q460 165 417 83Q397 41 362 16T301 -15T250 -22Q224 -22 198 -16T137 16T82 83Q39 165 39 320Q39 494 96 585ZM321 597Q291 629 250 629Q208 629 178 597Q153 571 145 525T137 333Q137 175 145 125T181 46Q209 16 250 16Q290 16 318 46Q347 76 354 130T362 333Q362 478 354 524T321 597Z"></path></g><g data-mml-node="mo" transform="translate(1236, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1680.7, 0)"><path data-c="6D" d="M21 287Q22 293 24 303T36 341T56 388T88 425T132 442T175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q303 442 384 442Q401 442 415 440T441 433T460 423T475 411T485 398T493 385T497 373T500 364T502 357L510 367Q573 442 659 442Q713 442 746 415T780 336Q780 285 742 178T704 50Q705 36 709 31T724 26Q752 26 776 56T815 138Q818 149 821 151T837 153Q857 153 857 145Q857 144 853 130Q845 101 831 73T785 17T716 -10Q669 -10 648 17T627 73Q627 92 663 193T700 345Q700 404 656 404H651Q565 404 506 303L499 291L466 157Q433 26 428 16Q415 -11 385 -11Q372 -11 364 -4T353 8T350 18Q350 29 384 161L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 181Q151 335 151 342Q154 357 154 369Q154 405 129 405Q107 405 92 377T69 316T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(2780.9, 0)"><path data-c="2B" d="M56 237T56 250T70 270H369V420L370 570Q380 583 389 583Q402 583 409 568V270H707Q722 262 722 250T707 230H409V-68Q401 -82 391 -82H389H387Q375 -82 369 -68V230H70Q56 237 56 250Z"></path></g><g data-mml-node="munder" transform="translate(3781.1, 0)"><g data-mml-node="mo" transform="translate(159.6, 0)"><path data-c="6D" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q351 442 364 440T387 434T406 426T421 417T432 406T441 395T448 384T452 374T455 366L457 361L460 365Q463 369 466 373T475 384T488 397T503 410T523 422T546 432T572 439T603 442Q729 442 740 329Q741 322 741 190V104Q741 66 743 59T754 49Q775 46 803 46H819V0H811L788 1Q764 2 737 2T699 3Q596 3 587 0H579V46H595Q656 46 656 62Q657 64 657 200Q656 335 655 343Q649 371 635 385T611 402T585 404Q540 404 506 370Q479 343 472 315T464 232V168V108Q464 78 465 68T468 55T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z" transform="translate(833, 0)"></path><path data-c="78" d="M201 0Q189 3 102 3Q26 3 17 0H11V46H25Q48 47 67 52T96 61T121 78T139 96T160 122T180 150L226 210L168 288Q159 301 149 315T133 336T122 351T113 363T107 370T100 376T94 379T88 381T80 383Q74 383 44 385H16V431H23Q59 429 126 429Q219 429 229 431H237V385Q201 381 201 369Q201 367 211 353T239 315T268 274L272 270L297 304Q329 345 329 358Q329 364 327 369T322 376T317 380T310 384L307 385H302V431H309Q324 428 408 428Q487 428 493 431H499V385H492Q443 385 411 368Q394 360 377 341T312 257L296 236L358 151Q424 61 429 57T446 50Q464 46 499 46H516V0H510H502Q494 1 482 1T457 2T432 2T414 3Q403 3 377 3T327 1L304 0H295V46H298Q309 46 320 51T331 63Q331 65 291 120L250 175Q249 174 219 133T185 88Q181 83 181 74Q181 63 188 55T206 46Q208 46 208 23V0H201Z" transform="translate(1333, 0)"></path></g><g data-mml-node="TeXAtom" transform="translate(0, -684.3) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g><g data-mml-node="mo" transform="translate(412, 0)"><path data-c="3A" d="M78 370Q78 394 95 412T138 430Q162 430 180 414T199 371Q199 346 182 328T139 310T96 327T78 370ZM78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g><g data-mml-node="msub" transform="translate(690, 0)"><g data-mml-node="mi"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(490, -150) scale(0.707)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g><g data-mml-node="mo" transform="translate(1521.3, 0)"><path data-c="2260" d="M166 -215T159 -215T147 -212T141 -204T139 -197Q139 -190 144 -183L306 133H70Q56 140 56 153Q56 168 72 173H327L406 327H72Q56 332 56 347Q56 360 70 367H426Q597 702 602 707Q605 716 618 716Q625 716 630 712T636 703T638 696Q638 692 471 367H707Q722 359 722 347Q722 336 708 328L451 327L371 173H708Q722 163 722 153Q722 140 707 133H351Q175 -210 170 -212Q166 -215 159 -215Z"></path></g><g data-mml-node="msub" transform="translate(2299.3, 0)"><g data-mml-node="mi"><path data-c="79" d="M21 287Q21 301 36 335T84 406T158 442Q199 442 224 419T250 355Q248 336 247 334Q247 331 231 288T198 191T182 105Q182 62 196 45T238 27Q261 27 281 38T312 61T339 94Q339 95 344 114T358 173T377 247Q415 397 419 404Q432 431 462 431Q475 431 483 424T494 412T496 403Q496 390 447 193T391 -23Q363 -106 294 -155T156 -205Q111 -205 77 -183T43 -117Q43 -95 50 -80T69 -58T89 -48T106 -45Q150 -45 150 -87Q150 -107 138 -122T115 -142T102 -147L99 -148Q101 -153 118 -160T152 -167H160Q177 -167 186 -165Q219 -156 247 -127T290 -65T313 -9T321 21L315 17Q309 13 296 6T270 -6Q250 -11 231 -11Q185 -11 150 11T104 82Q103 89 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(490, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g data-mml-node="mo" transform="translate(5961.3, 0)"><path data-c="27E8" d="M333 -232Q332 -239 327 -244T313 -250Q303 -250 296 -240Q293 -233 202 6T110 250T201 494T296 740Q299 745 306 749L309 750Q312 750 313 750Q331 750 333 732Q333 727 243 489Q152 252 152 250T243 11Q333 -227 333 -232Z"></path></g><g data-mml-node="msubsup" transform="translate(6350.3, 0)"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="TeXAtom" transform="translate(465, 413) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="73" d="M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z"></path></g><g data-mml-node="mi" transform="translate(469, 0)"><path data-c="63" d="M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z"></path></g></g><g data-mml-node="mi" transform="translate(465, -247) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(7503.1, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msubsup" transform="translate(7947.8, 0)"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="TeXAtom" transform="translate(465, 413) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="6F" d="M201 -11Q126 -11 80 38T34 156Q34 221 64 279T146 380Q222 441 301 441Q333 441 341 440Q354 437 367 433T402 417T438 387T464 338T476 268Q476 161 390 75T201 -11ZM121 120Q121 70 147 48T206 26Q250 26 289 58T351 142Q360 163 374 216T388 308Q388 352 370 375Q346 405 306 405Q243 405 195 347Q158 303 140 230T121 120Z"></path></g></g><g data-mml-node="mi" transform="translate(465, -247) scale(0.707)"><path data-c="6A" d="M297 596Q297 627 318 644T361 661Q378 661 389 651T403 623Q403 595 384 576T340 557Q322 557 310 567T297 596ZM288 376Q288 405 262 405Q240 405 220 393T185 362T161 325T144 293L137 279Q135 278 121 278H107Q101 284 101 286T105 299Q126 348 164 391T252 441Q253 441 260 441T272 442Q296 441 316 432Q341 418 354 401T367 348V332L318 133Q267 -67 264 -75Q246 -125 194 -164T75 -204Q25 -204 7 -183T-12 -137Q-12 -110 7 -91T53 -71Q70 -71 82 -81T95 -112Q95 -148 63 -167Q69 -168 77 -168Q111 -168 139 -140T182 -74L193 -32Q204 11 219 72T251 197T278 308T289 365Q289 372 288 376Z"></path></g></g><g data-mml-node="mo" transform="translate(8805.7, 0)"><path data-c="27E9" d="M55 732Q56 739 61 744T75 750Q85 750 92 740Q95 733 186 494T278 250T187 6T92 -240Q85 -250 75 -250Q67 -250 62 -245T55 -232Q55 -227 145 11Q236 248 236 250T145 489Q55 727 55 732Z"></path></g><g data-mml-node="mo" transform="translate(9417, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mo" transform="translate(10417.2, 0)"><path data-c="27E8" d="M333 -232Q332 -239 327 -244T313 -250Q303 -250 296 -240Q293 -233 202 6T110 250T201 494T296 740Q299 745 306 749L309 750Q312 750 313 750Q331 750 333 732Q333 727 243 489Q152 252 152 250T243 11Q333 -227 333 -232Z"></path></g><g data-mml-node="msubsup" transform="translate(10806.2, 0)"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="TeXAtom" transform="translate(465, 413) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="73" d="M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z"></path></g><g data-mml-node="mi" transform="translate(469, 0)"><path data-c="63" d="M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z"></path></g></g><g data-mml-node="mi" transform="translate(465, -247) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(11959, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msubsup" transform="translate(12403.7, 0)"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="TeXAtom" transform="translate(465, 413) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="6F" d="M201 -11Q126 -11 80 38T34 156Q34 221 64 279T146 380Q222 441 301 441Q333 441 341 440Q354 437 367 433T402 417T438 387T464 338T476 268Q476 161 390 75T201 -11ZM121 120Q121 70 147 48T206 26Q250 26 289 58T351 142Q360 163 374 216T388 308Q388 352 370 375Q346 405 306 405Q243 405 195 347Q158 303 140 230T121 120Z"></path></g></g><g data-mml-node="mi" transform="translate(465, -247) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g><g data-mml-node="mo" transform="translate(13261.6, 0)"><path data-c="27E9" d="M55 732Q56 739 61 744T75 750Q85 750 92 740Q95 733 186 494T278 250T187 6T92 -240Q85 -250 75 -250Q67 -250 62 -245T55 -232Q55 -227 145 11Q236 248 236 250T145 489Q55 727 55 732Z"></path></g><g data-mml-node="mo" transform="translate(13650.6, 0)"><path data-c="29" d="M34 1438Q34 1446 37 1448T50 1450H56H71Q73 1448 99 1423T144 1380T198 1319T260 1238T323 1137T385 1013T440 864T485 688T514 485T526 251Q526 134 519 53Q472 -519 162 -860Q139 -885 119 -904T86 -936T71 -949H56Q43 -949 39 -947T34 -937Q88 -883 140 -813Q428 -430 428 251Q428 453 402 628T338 922T245 1146T145 1309T46 1425Q44 1427 42 1429T39 1433T36 1436L34 1438Z"></path></g></g></g></g></g><g></g></svg></p></span><span leaf="">其中 </span><span style="cursor:pointer;" data-formula="z_i^{sc}"><span data-formula="z_i^{sc}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -675.5 1152.8 975.5" aria-hidden="true" style="vertical-align: -0.679ex;width: 2.608ex;height: 2.207ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="TeXAtom" transform="translate(465, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="73" d="M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z"></path></g><g data-mml-node="mi" transform="translate(469, 0)"><path data-c="63" d="M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z"></path></g></g><g data-mml-node="mi" transform="translate(465, -292.2) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 是指令嵌入，</span><span style="cursor:pointer;" data-formula="z_i^{o}"><span data-formula="z_i^{o}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -674.8 857.9 974.8" aria-hidden="true" style="vertical-align: -0.679ex;width: 1.941ex;height: 2.205ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msubsup"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="TeXAtom" transform="translate(465, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="6F" d="M201 -11Q126 -11 80 38T34 156Q34 221 64 279T146 380Q222 441 301 441Q333 441 341 440Q354 437 367 433T402 417T438 387T464 338T476 268Q476 161 390 75T201 -11ZM121 120Q121 70 147 48T206 26Q250 26 289 58T351 142Q360 163 374 216T388 308Q388 352 370 375Q346 405 306 405Q243 405 195 347Q158 303 140 230T121 120Z"></path></g></g><g data-mml-node="mi" transform="translate(465, -292.2) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g><g></g></svg></span></span><span leaf=""> 是对应的概念嵌入。保证模型在理解具体指令时，不会跑出大类别的“五行之外”。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">掩码分布对齐损失 (</span><span style="cursor:pointer;" data-formula="\mathcal{L}_{\text{mask}}"><span data-formula="\mathcal{L}_{\text{mask}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 2334.5 862.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 5.282ex;height: 1.952ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="6D" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 122T103 161T103 203Q103 234 103 269T102 328V351Q99 370 88 376T43 385H25V408Q25 431 27 431L37 432Q47 433 65 434T102 436Q119 437 138 438T167 441T178 442H181V402Q181 364 182 364T187 369T199 384T218 402T247 421T285 437Q305 442 336 442Q351 442 364 440T387 434T406 426T421 417T432 406T441 395T448 384T452 374T455 366L457 361L460 365Q463 369 466 373T475 384T488 397T503 410T523 422T546 432T572 439T603 442Q729 442 740 329Q741 322 741 190V104Q741 66 743 59T754 49Q775 46 803 46H819V0H811L788 1Q764 2 737 2T699 3Q596 3 587 0H579V46H595Q656 46 656 62Q657 64 657 200Q656 335 655 343Q649 371 635 385T611 402T585 404Q540 404 506 370Q479 343 472 315T464 232V168V108Q464 78 465 68T468 55T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z" transform="translate(833, 0)"></path><path data-c="73" d="M295 316Q295 356 268 385T190 414Q154 414 128 401Q98 382 98 349Q97 344 98 336T114 312T157 287Q175 282 201 278T245 269T277 256Q294 248 310 236T342 195T359 133Q359 71 321 31T198 -10H190Q138 -10 94 26L86 19L77 10Q71 4 65 -1L54 -11H46H42Q39 -11 33 -5V74V132Q33 153 35 157T45 162H54Q66 162 70 158T75 146T82 119T101 77Q136 26 198 26Q295 26 295 104Q295 133 277 151Q257 175 194 187T111 210Q75 227 54 256T33 318Q33 357 50 384T93 424T143 442T187 447H198Q238 447 268 432L283 424L292 431Q302 440 314 448H322H326Q329 448 335 442V310L329 304H301Q295 310 295 316Z" transform="translate(1333, 0)"></path><path data-c="6B" d="M36 46H50Q89 46 97 60V68Q97 77 97 91T97 124T98 167T98 217T98 272T98 329Q98 366 98 407T98 482T98 542T97 586T97 603Q94 622 83 628T38 637H20V660Q20 683 22 683L32 684Q42 685 61 686T98 688Q115 689 135 690T165 693T176 694H179V463L180 233L240 287Q300 341 304 347Q310 356 310 364Q310 383 289 385H284V431H293Q308 428 412 428Q475 428 484 431H489V385H476Q407 380 360 341Q286 278 286 274Q286 273 349 181T420 79Q434 60 451 53T500 46H511V0H505Q496 3 418 3Q322 3 307 0H299V46H306Q330 48 330 65Q330 72 326 79Q323 84 276 153T228 222L176 176V120V84Q176 65 178 59T189 49Q210 46 238 46H254V0H246Q231 3 137 3T28 0H20V46H36Z" transform="translate(1727, 0)"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">)</span></b><span leaf="">：利用 KL 散度让简单分支和复杂分支输出的预测概率分布尽可能一致。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">不确定性感知硬区域监督 (</span><span style="cursor:pointer;" data-formula="\mathcal{L}_{\text{hard}}"><span data-formula="\mathcal{L}_{\text{hard}}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -705 2157 862.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 4.88ex;height: 1.952ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mi"><path data-c="4C" d="M62 -22T47 -22T32 -11Q32 -1 56 24T83 55Q113 96 138 172T180 320T234 473T323 609Q364 649 419 677T531 705Q559 705 578 696T604 671T615 645T618 623V611Q618 582 615 571T598 548Q581 531 558 520T518 509Q503 509 503 520Q503 523 505 536T507 560Q507 590 494 610T452 630Q423 630 410 617Q367 578 333 492T271 301T233 170Q211 123 204 112L198 103L224 102Q281 102 369 79T509 52H523Q535 64 544 87T579 128Q616 152 641 152Q656 152 656 142Q656 101 588 40T433 -22Q381 -22 289 1T156 28L141 29L131 20Q111 0 87 -11Z"></path></g></g><g data-mml-node="TeXAtom" transform="translate(690, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mtext"><path data-c="68" d="M41 46H55Q94 46 102 60V68Q102 77 102 91T102 124T102 167T103 217T103 272T103 329Q103 366 103 407T103 482T102 542T102 586T102 603Q99 622 88 628T43 637H25V660Q25 683 27 683L37 684Q47 685 66 686T103 688Q120 689 140 690T170 693T181 694H184V367Q244 442 328 442Q451 442 463 329Q464 322 464 190V104Q464 66 466 59T477 49Q498 46 526 46H542V0H534L510 1Q487 2 460 2T422 3Q319 3 310 0H302V46H318Q379 46 379 62Q380 64 380 200Q379 335 378 343Q372 371 358 385T334 402T308 404Q263 404 229 370Q202 343 195 315T187 232V168V108Q187 78 188 68T191 55T200 49Q221 46 249 46H265V0H257L234 1Q210 2 183 2T145 3Q42 3 33 0H25V46H41Z"></path><path data-c="61" d="M137 305T115 305T78 320T63 359Q63 394 97 421T218 448Q291 448 336 416T396 340Q401 326 401 309T402 194V124Q402 76 407 58T428 40Q443 40 448 56T453 109V145H493V106Q492 66 490 59Q481 29 455 12T400 -6T353 12T329 54V58L327 55Q325 52 322 49T314 40T302 29T287 17T269 6T247 -2T221 -8T190 -11Q130 -11 82 20T34 107Q34 128 41 147T68 188T116 225T194 253T304 268H318V290Q318 324 312 340Q290 411 215 411Q197 411 181 410T156 406T148 403Q170 388 170 359Q170 334 154 320ZM126 106Q126 75 150 51T209 26Q247 26 276 49T315 109Q317 116 318 175Q318 233 317 233Q309 233 296 232T251 223T193 203T147 166T126 106Z" transform="translate(556, 0)"></path><path data-c="72" d="M36 46H50Q89 46 97 60V68Q97 77 97 91T98 122T98 161T98 203Q98 234 98 269T98 328L97 351Q94 370 83 376T38 385H20V408Q20 431 22 431L32 432Q42 433 60 434T96 436Q112 437 131 438T160 441T171 442H174V373Q213 441 271 441H277Q322 441 343 419T364 373Q364 352 351 337T313 322Q288 322 276 338T263 372Q263 381 265 388T270 400T273 405Q271 407 250 401Q234 393 226 386Q179 341 179 207V154Q179 141 179 127T179 101T180 81T180 66V61Q181 59 183 57T188 54T193 51T200 49T207 48T216 47T225 47T235 46T245 46H276V0H267Q249 3 140 3Q37 3 28 0H20V46H36Z" transform="translate(1056, 0)"></path><path data-c="64" d="M376 495Q376 511 376 535T377 568Q377 613 367 624T316 637H298V660Q298 683 300 683L310 684Q320 685 339 686T376 688Q393 689 413 690T443 693T454 694H457V390Q457 84 458 81Q461 61 472 55T517 46H535V0Q533 0 459 -5T380 -11H373V44L365 37Q307 -11 235 -11Q158 -11 96 50T34 215Q34 315 97 378T244 442Q319 442 376 393V495ZM373 342Q328 405 260 405Q211 405 173 369Q146 341 139 305T131 211Q131 155 138 120T173 59Q203 26 251 26Q322 26 373 103V342Z" transform="translate(1448, 0)"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">)</span></b><span leaf="">：通过计算两个分支的 Jensen-Shannon 散度来识别语义模糊区域（如遮挡、复杂关系），并对这些区域施加更高的监督权重。</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">HMPL-Instruct：大规模指令数据集</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了训练 SAM3-I，研究团队构建了 </span><strong style="color: rgba(0, 0, 0, 0.85);font-weight: bold;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: left;background-position-y: top;background-repeat: no-repeat;background-size: auto;width: auto;height: auto;margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;border-top-style: none;border-bottom-style: none;border-left-style: none;border-right-style: none;border-top-width: 3px;border-bottom-width: 3px;border-left-width: 3px;border-right-width: 3px;border-top-color: rgba(0, 0, 0, 0.4);border-bottom-color: rgba(0, 0, 0, 0.4);border-left-color: rgba(0, 0, 0, 0.4);border-right-color: rgba(0, 0, 0, 0.4);border-top-left-radius: 0px;border-top-right-radius: 0px;border-bottom-right-radius: 0px;border-bottom-left-radius: 0px;"><span leaf="">HMPL-Instruct</span></strong><span leaf=""> 数据集。它基于 PACO-LVIS 构建，通过一个自动生成、代理检查、人工修正的“人机协作”流水线，生成了约 85 万条高质量指令。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="HMPL-Instruct 数据集统计：覆盖了丰富的指令层级和目标粒度" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175242" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.31666666666666665" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=47713051&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9JFVjgRKFg3jvQsNsHXG0CJ7iaMgBlpz6why7xKicyAeVugMYOFOBwI0mfpu3eo5qCYSHDicCGQwKkibH3A9UcgZLpgShuCsEcNy8%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">HMPL-Instruct 数据集统计：覆盖了丰富的指令层级和目标粒度</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这个数据集填补了现有指令分割数据的多个空白：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">多层级指令</span></b><span leaf="">：从简单的名词短语到复杂的推理问答。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">多粒度目标</span></b><span leaf="">：不仅支持物体级分割，还支持精细的部件级（Part-level）分割。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">多样化对应关系</span></b><span leaf="">：涵盖了一对一、一对多（One-to-Many）和一对全（One-to-All）。特别是“一对多”场景，需要模型从一堆相似物体中选出特定子集，极具挑战。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="人机协作的数据构建流程：包含自动标注、质量检查和人工纠偏" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175245" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.48518518518518516" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=c2ddffc9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW93aeV12bmaqqVsHCdkZudCwOTcdY6lY7EuvD0S96k4oy6WTsYmpKPAh6W0ibW1ibJRIprBHoFqsCjfCFdYRdclngFh0UrzCrdS4%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">人机协作的数据构建流程：包含自动标注、质量检查和人工纠偏</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果：小参数迸发大能量</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在性能表现上，SAM3-I 展现出了惊人的爆发力。在 HMPL-Instruct 数据集上，SAM3-I（1.1B 参数）相比于 8.8B 参数的 SAM3 Agent 方案，表现出了压倒性优势：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">简单指令</span></b><span leaf="">：gIoU 提升了 </span><font color="#0000FF"><b><span leaf="">31.3</span></b></font><span leaf="">。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">复杂指令</span></b><span leaf="">：gIoU 提升了 </span><font color="#0000FF"><b><span leaf="">22.6</span></b></font><span leaf="">。</span></p></li></ul><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="SAM3-I 与基线模型的定量对比：在保持概念分割性能的同时，大幅提升指令分割能力" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175243" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.21851851851851853" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=d46a5122&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicFS0RyklhIP0mSRtiaLeI0fuDsticvicjErOY2EiaC4jSRf2Hln16WBt1zrP8ACUeJmLSEm2kjdQXLES4hictib9UeacBO0aMIvVEl0%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">SAM3-I 与基线模型的定量对比：在保持概念分割性能的同时，大幅提升指令分割能力</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">更令人惊喜的是，SAM3-I 在部件级分割（Part Level）上的表现也非常稳健，gIoU 达到了 </span><font color="#0000FF"><b><span leaf="">47.2</span></b></font><span leaf="">，远超之前的 SOTA 模型。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175244" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.46888567293777134" data-w="691" src="https://wechat2rss.xlab.app/img-proxy/?k=ebf32727&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8RrILKbFFhNHeADYSuNnMkvon64OXkbibJEOGETIXhXMTeEJfVTiaaYtvCuPcgibIdELoTicdh1drjcUhb4l9VUzBAkcODRvt4wyk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">从视觉效果上看，SAM3-I 的优势更加直观。比如下图面对“那个带有铬合金排气管的黑色管子”这种细节描述，Agent 方案往往会错误地分割整个摩托车，而 SAM3-I 则能精准地剥离出那个特定的部件。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="定性对比结果：SAM3-I 在细节识别和隐喻推理上表现更佳" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175246" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.4351851851851852" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=8206963b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWiclpuOEEicNiaOBulksMDibHF7uSia7gokxL5gk2es1lHKtjRJuHX1uLFmZ6hgzfOqic58Q5ZA1Km4TgYAIzF5ibXiaJRwcHtyBqMbr6Q%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">定性对比结果：SAM3-I 在细节识别和隐喻推理上表现更佳</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在最难的“一对多”推理场景中，比如“找出图中两个用来装饮料的白色带柄物体”，SAM3-I 能够准确识别出特定的两只杯子，而不会被旁边的白色盘子干扰。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="多粒度目标分割结果：SAM3-I 能够处理复杂的数量和功能约束" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175250" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="1.6123260437375746" data-w="1006" src="https://wechat2rss.xlab.app/img-proxy/?k=3f70dcf1&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW8aeoAbYia9icKA8tTKWqFhzIjvGgAShF2zUyw1heJx4MSNMQvia1mW6nh7IR9h9gLsQ9mq8RBjzTswvB98P7FNNkvgzaBDdAloqk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">多粒度目标分割结果：SAM3-I 能够处理复杂的数量和功能约束</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">SAM3-I 的出现，标志着 SAM 家族正式迈入了“指令驱动”的新阶段。它最令人印象深刻的地方在于，通过一种极其轻量的适配器设计，就让 11 亿参数的模型在指令理解上超越了 88 亿参数的 Agent 组合。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">有意思的是背后的研究思路，在追求大模型能力的今天，如何让垂直领域的模型直接具备推理能力，而不是简单地挂载一个通用大模型，或许是提升效率和精度的关键。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前 SAM3-I 已经开源，感兴趣的朋友可以去测试啦！</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175248" data-type="gif" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.125" data-w="960" src="https://wechat2rss.xlab.app/img-proxy/?k=7d7f1382&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW8yYln8LHn3FSBVesoP1LzZbMThCxsibr2pnLg0EHvKFXiaT0mHpIuPs6U9RGBXVFAI4GvhuxxLAQNMOIes8QTqtOiat5pmPUic0fU%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175247" data-type="png" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" data-ratio="0.7064814814814815" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=e14eae30&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGW9HC2gwWaZgIHHGjibd3Ks8ias7dxepZDKxOILw6gLyPpT91KqWvXOgWJbVibs2nvgFexg0wOD9wEobxN77kcqtmRad9dlIAOM49w%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">入群加好友(v:xiao-ma-baoli)，请备注你感兴趣的技术方向</span></figcaption></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=e8665d2b&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247658916%26idx%3D1%26sn%3Dd8d060efbb6ca621d36b62fcdd2a5163">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Tue, 21 Apr 2026 15:02:00 +0800</pubDate>
    </item>
    <item>
      <title>美团发布 LARYBench：120万视频、151类动作，首个解耦评估”潜动作表征“的大规模基准</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzIwMTE1NjQxMQ==&amp;mid=2247658821&amp;idx=1&amp;sn=0d824e2ea4ab761b588657a73b1b6388</link>
      <description>代码和部分训练数据已经开源</description>
      <content:encoded><![CDATA[<p>原创 <span>CV君</span> <span>2026-04-20 12:35</span> <span style="display: inline-block;">江苏</span></p>






  
  <p><img src="https://wechat2rss.xlab.app/img-proxy/?k=8f50ef45&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_jpg%2FP9MWBRYIGWibicAlCmcic7nZ8IzpoRtUibyrA2XB03xEQ6MDvkf8ETHSvRPROZbibOSbrkJexTdoO7YhdicYBIbmnnt7KHC4RyicFib0EPq9Ubla3po%2F0%3Fwx_fmt%3Djpeg"/></p>
  <p>代码和部分训练数据已经开源</p>
  <div data-tool="mdnice编辑器" data-website="https://www.mdnice.com" style="margin-top: 0px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;background-attachment: scroll;background-clip: border-box;background-color: rgba(0, 0, 0, 0);background-image: none;background-origin: padding-box;background-position-x: 0%;background-position-y: 0%;background-repeat: no-repeat;background-size: auto;width: auto;font-family: PingFangSC-Light, &#39;PingFang SC&#39;, &#39;Microsoft YaHei&#39;, sans-serif;font-size: 16px;color: rgb(0, 0, 0);line-height: 1.5em;word-spacing: 0em;letter-spacing: 0em;word-break: break-word;overflow-wrap: break-word;text-align: left;padding-top: 10px;padding-right: 10px;padding-bottom: 10px;padding-left: 10px;" data-pm-slice="0 0 []"><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175159" data-ratio="0.2778649921507064" data-type="gif" data-w="637" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=f5456a7c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_gif%2FP9MWBRYIGWicmqTahr0I3urxiam7NPo0WbOibIVsHCwG86w4Nd3gt4cGRia1VUcPNWVTeSwoia9Tx5fvNrDrujibDhHCnx35sVrhAcu6Quy57c6y0%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在具身智能（Embodied AI）的研究中，我们经常会听到一个词：</span><b><span leaf="">数据孤岛</span></b><span leaf="">。相比于互联网上取之不尽的文本和图像，高质量的机器人动作数据（带标签的指令-动作对）简直稀缺得像沙漠里的绿洲。为了打破这个瓶颈，很多研究者开始把目光投向了海量的人类活动视频——既然人类能通过观察学会动作，机器人是不是也可以？</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">于是，“潜动作表征（Latent Action Representation）”的概念应运而生。它的核心思想是：在没有显式动作标签的情况下，通过观察视频中每一帧之间的视觉变化，提取出一种通用的、与具体机器人形态无关的“动作特征”。但问题来了，我们怎么知道这些提取出来的“潜动作”到底好不好用？</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">近日，来自</span><b><span leaf="">美团</span></b><span leaf="">的研究团队发布了 </span><b><span leaf="">LARY</span></b><span leaf=""> 评测基准，是 “</span><b><span leaf="">Latent Action Representation Yielding</span></b><span leaf="">” 的缩写，意为“生成潜动作表征”，旨在为视觉到动作的对齐提供一个标准化的“试金石”。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175163" data-ratio="0.20277777777777778" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=2054c1f6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWib8ab04OGcEtI74Y7P4CLic4UAdPODryAhcWHvYfibVowIhNnh2gZjR6NcrewFf0FDg63XhTOHlRKPrxRgbZbEIt8OGzh0vy9084%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">论文地址</span></b><span leaf="">: <a href="https://arxiv.org/abs/2604.11689" target="_blank">https://arxiv.org/abs/2604.11689</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">项目主页</span></b><span leaf="">: <a href="https://meituan-longcat.github.io/LARYBench" target="_blank">https://meituan-longcat.github.io/LARYBench</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">代码仓库</span></b><span leaf="">: <a href="https://github.com/meituan-longcat/LARYBench" target="_blank">https://github.com/meituan-longcat/LARYBench</a> (已开源)</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">Hugging Face</span></b><span leaf="">: <a href="https://huggingface.co/datasets/meituan-longcat/LARYBench" target="_blank">https://huggingface.co/datasets/meituan-longcat/LARYBench</a></span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">机构</span></b><span leaf="">: 美团</span></p></li></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">背景与动机：当具身智能遇上“无米之炊”</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前的视觉-语言-动作模型（Vision-Language-Action, VLA）正面临严重的动作数据短缺。虽然我们可以通过遥操作（Teleoperation）采集数据，但成本极高且难以规模化。相比之下，人类动作视频虽然没有动作标签，但包含了丰富的物理交互逻辑。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了利用这些视频，研究者们开发了各种</span><b><span leaf="">潜动作模型（Latent Action Model, LAM）</span></b><span leaf="">，比如 LAPA 或 UniVLA。它们尝试将视频帧之间的视觉变化编码为离散的“动作 Token”。然而，现有的评估手段非常单一，通常只是看看下游任务的成功率，或者做一些聚类可视化。这样的评估显然是不够具有指导意义的，就像是还没学会走路就直接考百米赛跑，我们无法分辨到底是“动作表征”学得不好，还是“决策策略”出了问题。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">文中美团团队认为，我们需要将</span><b><span leaf="">动作表征的质量</span></b><span leaf="">与</span><b><span leaf="">下游策略的性能</span></b><span leaf="">解耦。这就是 LARYBench 诞生的初衷：它要从“语义理解”和“物理控制”两个维度，给潜动作表征打分。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">LARYBench：海量数据构建的“全能考场”</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">LARYBench 的规模非常庞大，它涵盖了超过 120 万个视频剪辑（总时长超过 1000 小时）、62 万个图像对和近 60 万条运动轨迹。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="LARYBench 评估框架概览，涵盖了动作泛化和机器人控制两个核心维度" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175161" data-ratio="0.6240740740740741" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=7f7a5581&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibEhr0de7wrIIicqeefxvPAvT1LkMmRzvJeEPZ08Y215AYe1rs0OIj4w8spjR4ADnYjMFmg1IasQ1NQ1Vj2md2NChZ3B9GaSNzc%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">LARYBench 评估框架概览，涵盖了动作泛化和机器人控制两个核心维度</span></figcaption></figure><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 两个维度的深度评测</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了全面衡量潜动作的质量，LARYBench 设计了两个核心任务：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">高层语义理解（What to do）</span></b><span leaf="">：评估模型能否泛化到多样的动作类别。这包括 28 种</span><b><span leaf="">运动学原子原语（Atomic Primitives）</span></b><span leaf="">（如“向上移动”、“关闭夹爪”）和 145 种</span><b><span leaf="">复杂行为（Composite Behaviors）</span></b><span leaf="">（如“拿起”、“放置”、“扭转”）。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">底层物理控制（How to do）</span></b><span leaf="">：评估模型是否保留了足够的物理细节来重建末端执行器的轨迹。</span></p></li></ul><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 自动化的“数据工厂”</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">面对来自 Ego4D、TACO 等来源各异、标注混乱的原始数据，美团开发了一套自动化的数据引擎。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="LARYBench 的数据处理流程，利用 VLM 进行精准的时间分割和语义对齐" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175157" data-ratio="0.5388888888888889" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=79f90d2e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicSru0GtRt8uU9NKo2Cb9BxtUZQbyMZ8HN2GgPydsT3qgV1uaSV4GLnvp7gDict8I7Hyt4I0CRXwaQb3yxNia6ZaBMcXtDia25icFI%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">LARYBench 的数据处理流程，利用 VLM 进行精准的时间分割和语义对齐</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这套引擎利用视觉语言模型（VLM）的理解能力，对视频进行精准的</span><b><span leaf="">时间分割</span></b><span leaf="">和</span><b><span leaf="">语义对齐</span></b><span leaf="">。比如，它能从一段冗长的视频中准确切出“倒水”的那几秒钟，并确保视觉画面与“倒水”这个动词严格匹配。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">技术详解：如何从视觉中“提取”动作？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">LARYBench 的评测流程非常严谨。其核心逻辑是：给定视觉观察序列 </span><span style="cursor:pointer;" data-formula="o_{1:T}"><span data-formula="o_{1:T}"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -441 1582.9 591" aria-hidden="true" style="vertical-align: -0.339ex;width: 3.581ex;height: 1.337ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="6F" d="M201 -11Q126 -11 80 38T34 156Q34 221 64 279T146 380Q222 441 301 441Q333 441 341 440Q354 437 367 433T402 417T438 387T464 338T476 268Q476 161 390 75T201 -11ZM121 120Q121 70 147 48T206 26Q250 26 289 58T351 142Q360 163 374 216T388 308Q388 352 370 375Q346 405 306 405Q243 405 195 347Q158 303 140 230T121 120Z"></path></g><g data-mml-node="TeXAtom" transform="translate(485, -150) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mn"><path data-c="31" d="M213 578L200 573Q186 568 160 563T102 556H83V602H102Q149 604 189 617T245 641T273 663Q275 666 285 666Q294 666 302 660V361L303 61Q310 54 315 52T339 48T401 46H427V0H416Q395 3 257 3Q121 3 100 0H88V46H114Q136 46 152 46T177 47T193 50T201 52T207 57T213 61V578Z"></path></g><g data-mml-node="mo" transform="translate(500, 0)"><path data-c="3A" d="M78 370Q78 394 95 412T138 430Q162 430 180 414T199 371Q199 346 182 328T139 310T96 327T78 370ZM78 60Q78 84 95 102T138 120Q162 120 180 104T199 61Q199 36 182 18T139 0T96 17T78 60Z"></path></g><g data-mml-node="mi" transform="translate(778, 0)"><path data-c="54" d="M40 437Q21 437 21 445Q21 450 37 501T71 602L88 651Q93 669 101 677H569H659Q691 677 697 676T704 667Q704 661 687 553T668 444Q668 437 649 437Q640 437 637 437T631 442L629 445Q629 451 635 490T641 551Q641 586 628 604T573 629Q568 630 515 631Q469 631 457 630T439 622Q438 621 368 343T298 60Q298 48 386 46Q418 46 427 45T436 36Q436 31 433 22Q429 4 424 1L422 0Q419 0 415 0Q410 0 363 1T228 2Q99 2 64 0H49Q43 6 43 9T45 27Q49 40 55 46H83H94Q174 46 189 55Q190 56 191 56Q196 59 201 76T241 233Q258 301 269 344Q339 619 339 625Q339 630 310 630H279Q212 630 191 624Q146 614 121 583T67 467Q60 445 57 441T43 437H40Z"></path></g></g></g></g></g><g></g></svg></span></span><span leaf="">，LAM 模型将其提取为潜变量 </span><span style="cursor:pointer;" data-formula="z"><span data-formula="z"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 465 453" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.052ex;height: 1.025ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g></g><g></g></svg></span></span><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="LARY 的整体流水线，展示了从数据构建、潜动作提取到最终评估的全过程" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175164" data-ratio="0.5361111111111111" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=3820d1b2&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWiccj5tl20SM9y3pxuM9O2uvhYjV0RyUZL4vQFkzibu2yZs2eicqNoNRk2UQ7YmxfjRVpO1ZI2n6XZJNW2EdDzgg1zkZUruJ7WNJk%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">LARY 的整体流水线，展示了从数据构建、潜动作提取到最终评估的全过程</span></figcaption></figure><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">输入（Input）</span></b><span leaf="">：视频帧序列或图像对。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">中间表征</span></b><span leaf="">：通过不同的模型（如 DINOv3, V-JEPA 2 或专门的 LAM）提取连续的潜动作向量 </span><span style="cursor:pointer;" data-formula="z"><span data-formula="z"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 465 453" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.052ex;height: 1.025ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g></g><g></g></svg></span></span><span leaf="">。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><b><span leaf="">输出（Output）</span></b><span leaf="">：</span></p></li><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">在</span><b><span leaf="">分类任务</span></b><span leaf="">中，</span><span style="cursor:pointer;" data-formula="z"><span data-formula="z"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 465 453" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.052ex;height: 1.025ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 被送入一个 4 层的注意力探测器（Attentive Probe），输出动作类别。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">在</span><b><span leaf="">回归任务</span></b><span leaf="">中，</span><span style="cursor:pointer;" data-formula="z"><span data-formula="z"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 465 453" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.052ex;height: 1.025ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g></g><g></g></svg></span></span><span leaf=""> 被送入一个 MLP 结构的“动作专家（Action Expert）”，输出机械臂末端执行器的连续轨迹坐标（7-DoF/12-DoF/16-DoF）。</span></p></li></ul></ul><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">实验结果：通用视觉模型竟比专用具身模型好</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">美团团队对比了 11 种模型，包括专门的具身 LAM、通用的语义编码器（如 DINOv3）和生成式像素编码器（如 Flux.2 的 VAE）。实验结果带来了一些颠覆性的认知。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">1. 语义理解：V-JEPA 2 独占鳌头</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在动作分类任务中，没有经过任何显式动作监督训练的通用视觉模型表现异常强悍。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="动作分类结果对比，通用视觉模型在各项指标上均大幅领先专门的具身模型" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175165" data-ratio="0.43796296296296294" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=01b0b1f3&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicvm3YibFG9MRVuvSQdOeibMiaFq8tlCmJFRf7PeZtibB4picAFaB7KIEYpnNZBGLx9KyRj1rwM3yJC2k3YCPBr8R4cnRHsicuyYia1JA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">动作分类结果对比，通用视觉模型在各项指标上均大幅领先专门的具身模型</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><font color="#0000FF"><b><span leaf="">V-JEPA 2</span></b></font><span leaf=""> 在综合准确率上达到了 </span><font color="#0000FF"><b><span leaf="">76.62%</span></b></font><span leaf="">，远超专门为机器人设计的 LAPA（20.17%）。这说明，大规模的视觉预训练已经让模型内部自发形成了对“动作语义”的深刻理解。</span></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">2. 物理控制：潜空间比像素空间更靠谱</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">在轨迹回归任务中，结果同样令人惊讶。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="动作回归（MSE）结果，数值越小越好" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175166" data-ratio="0.40185185185185185" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=25a105be&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGW9gfIQ9px5eMzfUibjmhiclyWicuKvDibc9KRx29uOULSzp9BY6pjF0xQDRLpeibRiaj3UuehnC3qicF7w5qYmandqib3luOY0dv4japmg%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">动作回归（MSE）结果，数值越小越好</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><font color="#0000FF"><b><span leaf="">DINOv3</span></b></font><span leaf=""> 取得了最低的均方误差（MSE），这意味着它对物理位移的感知最精准。更重要的是，基于潜特征（Latent-based）的模型普遍优于基于像素（Pixel-based）的模型（如 Wan2.2）。这暗示了：</span><b><span leaf="">未来的具身智能可能不需要去纠结如何生成完美的像素，而应该专注于在潜特征空间里对齐动作。</span></b></p><h3 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 15px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 18px;color: rgb(26, 98, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 4px;border-left-style: solid;border-left-color: rgb(26, 98, 255);"><span leaf="">3. 为什么专门的具身模型反而不行？</span></span></h3><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">作者发现，像 LAPA 这样专门训练的模型，往往因为数据量太小或者过早地施加了特定的约束，导致了</span><b><span leaf="">表征坍缩（Representation Collapse）</span></b><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="潜动作模型的性能演进，展示了通过优化量化瓶颈和引入通用视觉先验带来的提升" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175168" data-ratio="0.4222222222222222" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=06798cae&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibHdYwl7ZEAxBibiaCrWLfxEKKAY1sqKGT1pt3elJnFKZGzhzIibic83Gq1y0KpoHhKuQTepuF6EicZUia9hadkFwL5Q6CYQ7RCUREbQ%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">潜动作模型的性能演进，展示了通过优化量化瓶颈和引入通用视觉先验带来的提升</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">通过消融实验，美团提出了 </span><b><span leaf="">General LAM</span></b><span leaf="">：即将 LAPA 的训练范式“嫁接”到冻结的通用视觉骨干（如 DINOv3）上。这种组合既保留了视觉模型的强大先验，又获得了动作提取的能力，性能显著优于原始的具身模型。</span></p><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">深度洞察：模型到底在看哪里？</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">为了进一步分析错误原因，研究团队可视化了不同模型的注意力图（Attention Maps）。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="不同模型在“倒水”动作序列中的交叉注意力热图对比" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175169" data-ratio="0.37037037037037035" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=3705427c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fsz_mmbiz_png%2FP9MWBRYIGWibWrPQ6fJ17DM5uIVdD4HIzGoY9f0o0WHicVcGOcYYxSFHcMmGFjaTowfof410qXmr9oq62V8AUkIs8lCTbChOdm7Hujg85nkcc%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">不同模型在“倒水”动作序列中的交叉注意力热图对比</span></figcaption></figure><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">我们可以清晰地看到：</span></p><ul style="list-style-type: disc;margin-top: 8px;margin-bottom: 8px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 20px;padding-right: 0px;color: rgb(0, 82, 255);font-size: 15px;text-align: left;" class="list-paddingleft-1"><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><font color="#0000FF"><b><span leaf="">V-JEPA 2</span></b></font><span leaf=""> 和 </span><font color="#0000FF"><b><span leaf="">DINOv3</span></b></font><span leaf=""> 能够精准地锁定双手与物体（碗）的交互点。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">传统的具身模型（如 LAPA）的注意力非常分散，完全没有聚焦在关键物体上。</span></p></li><li><p style="margin-top: 5px;margin-bottom: 5px;word-spacing: 0.1em;color: rgb(1, 1, 1);font-size: 16px;line-height: 1.8em;letter-spacing: 0em;text-align: left;font-weight: normal;"><span leaf="">生成式模型（如 Flux.2）虽然画面生成得好，但注意力更偏向全局背景，而非局部的物理交互。</span></p></li></ul><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">这解释了为什么预测失败往往源于模型</span><b><span leaf="">无法集中注意力于动态交互的物体</span></b><span leaf="">。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img alt="长尾分布下的动作分类性能，展示了强模型在处理稀有动作时的优势" class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175167" data-ratio="0.4148148148148148" data-type="png" data-w="1080" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=39dad1bb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FP9MWBRYIGWicYYviaFgSzTQGwqIUmY8tJqrBtxarDIhxbibFp0R9atqZic8ZzUNia7O31ec6YAAjHTorAZibq7BCGJTPcswThcxNUiaASOy1mDCYgA%2F640%3Fwx_fmt%3Dpng%26from%3Dappmsg"/></span><figcaption style="display: block;font-family: PingFangSC-Light;color: rgb(136, 136, 136);font-size: 14px;line-height: 1.5em;letter-spacing: 0em;text-align: center;font-weight: normal;margin-top: 5px;margin-bottom: 0px;margin-left: 0px;margin-right: 0px;padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;"><span leaf="">长尾分布下的动作分类性能，展示了强模型在处理稀有动作时的优势</span></figcaption></figure><h2 data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: block;text-align: left;margin-top: 20px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span style="font-size: 20px;color: rgb(0, 82, 255);line-height: 1.5;letter-spacing: 0em;text-align: left;font-weight: bold;display: inline-block;padding-left: 10px;border-left-width: 8px;border-left-style: solid;border-left-color: rgb(0, 82, 255);"><span leaf="">写在最后</span></span></h2><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">美团的这项研究实际上为 VLA 的设计指明了一个新方向：</span><b><span leaf="">与其在稀缺的机器人数据上死磕动作空间，不如直接站在通用视觉模型的肩膀上。</span></b></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">LARYBench 的开源，不仅为社区提供了一个高质量的评测工具，更揭示了一个深刻的洞察——有效的动作特征可以从大规模视觉预训练中自然涌现，这恰是业内期待的研究范式。未来的具身智能系统，或许不再需要从零学习“如何动”，而是学习如何将这些已经存在的“视觉潜能”翻译成具体的控制指令。</span></p><p data-tool="mdnice编辑器" style="color: rgba(0, 0, 0, 0.85);font-size: 16px;line-height: 1.75;letter-spacing: 0.1em;text-align: justify;text-indent: 0em;padding-top: 8px;padding-bottom: 8px;padding-left: 0px;padding-right: 0px;margin-top: 5px;margin-right: 0px;margin-bottom: 5px;margin-left: 0px;word-spacing: 0.1em;"><span leaf="">目前代码和部分训练数据已经开源。</span></p><figure data-tool="mdnice编辑器" style="padding-top: 0px;padding-bottom: 0px;padding-left: 0px;padding-right: 0px;display: flex;flex-direction: column;justify-content: center;align-items: center;margin-top: 10px;margin-right: 0px;margin-bottom: 10px;margin-left: 0px;"><span leaf=""><img class="rich_pages wxw-img" data-aistatus="1" data-imgfileid="100175170" data-ratio="0.125" data-type="gif" data-w="960" style="display: block;max-width: 100%;border-style: none;border-width: 3px;border-color: rgba(0, 0, 0, 0.4);object-fit: fill;box-shadow: rgba(0, 0, 0, 0) 0px 0px 0px 0px;margin: 0px 10px;border-radius: 0px;height: auto !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=be37f5bb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FP9MWBRYIGW9zkHjWHyYLV3kSpnSMTHnCtibMPcuibqKACdExbzMvURYoic3jknRCDTv3lia3xYQg2Ojk4hZexG0NWaYKHKT6drcObjwzp6Xwcm4%2F640%3Fwx_fmt%3Dgif%26from%3Dappmsg"/></span></figure></div><p style="display: none;"><mp-style-type data-value="3"></mp-style-type></p>



<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=86c2f1e0&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzIwMTE1NjQxMQ%3D%3D%26mid%3D2247658821%26idx%3D1%26sn%3D0d824e2ea4ab761b588657a73b1b6388">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 20 Apr 2026 12:35:00 +0800</pubDate>
    </item>
  </channel>
</rss>