<?xml version="1.0" encoding="UTF-8"?><rss version="2.0" xmlns:content="http://purl.org/rss/1.0/modules/content/">
  <channel>
    <title>腾讯安全智能</title>
    <link>https://wechat2rss.xlab.app/feed/88c9f7cfba0f4f60415eedf32cc5958b131c7065.xml</link>
    <description>该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。&#xA;(wechat feed made by @ttttmr https://wechat2rss.xlab.app)</description>
    <managingEditor> (腾讯安全智能)</managingEditor>
    <image>
      <url>http://wx.qlogo.cn/mmhead/Q3auHgzwzM5yUkJnXpjjrlWZOYickTGic2J3qZmzA8tkyVlwvSm73zSA/0</url>
      <title>腾讯安全智能</title>
      <link>https://wechat2rss.xlab.app/feed/88c9f7cfba0f4f60415eedf32cc5958b131c7065.xml</link>
    </image>
    <item>
      <title>腾讯安全公开课：威胁情报与NDR结合的最佳实践</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247488148&amp;idx=1&amp;sn=ba989e532922cc893b76748ddd35eca7</link>
      <description>揭秘威胁情报如何护航企业</description>
      <content:encoded><![CDATA[<p>
<span></span> <span>2021-11-29 12:05</span> <span style="display: inline-block;"></span>
</p>

<p>揭秘威胁情报如何护航企业</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=2f18e8f7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavQpDMIibF66u3xcmbFXTibvBwicNNfOnEBO17dmz4ibv24upfBDFrwRaTV84ARsDictNhwBHfBMickJ9kxQ%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<section class="channels_iframe_wrp" data-mpa-powered-by="yiban.io"><mpvideosnap class="js_uneditable custom_select_card channels_live_iframe" data-pluginname="videosnap" data-headimgurl="https://wx.qlogo.cn/finderhead/ajNVdqHZLLDYZWjzg8aicSAWGzmNJRY5LoAqO6o7st5c0k5Az5SlBiaQ/0" data-username="v2_060000231003b20faec8c7e0811acbd3ce05e835b07754d6baba1b909d55e8423a5cdb3b7b60@finder" data-nickname="腾讯安全" data-desc="将在11月29日 19:00 直播" data-intro="产业安全公开课：威胁情报与NDR结合的最佳实践" data-noticeid="finderlivenotice-v2_060000231003b20faec8c7e0811acbd3ce05e835b07754d6baba1b909d55e8423a5cdb3b7b60@finder-1637810504380411-405914331" data-type="live"></mpvideosnap></section><section style="white-space: normal;text-align: justify;line-height: 2em;margin-left: 16px;margin-right: 16px;">各位，腾讯安全威胁情报的线上技术公开课马上就要开始啦！</section><section style="white-space: normal;text-align: justify;line-height: 2em;margin-left: 16px;margin-right: 16px;"><br/></section><section style="white-space: normal;text-align: justify;line-height: 2em;margin-left: 16px;margin-right: 16px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">这次我们将在今晚上7点给大家带来</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">《<strong>威胁情报与NDR的最佳实践》</strong>，</span></section><section style="white-space: normal;text-align: justify;line-height: 2em;margin-left: 16px;margin-right: 16px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;"><br/></span></section><section style="white-space: normal;text-align: justify;line-height: 2em;margin-left: 16px;margin-right: 16px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">欢迎大家直播间点赞拍砖撒花刷火箭🚀，</span></section><section style="white-space: normal;text-align: justify;line-height: 2em;margin-left: 16px;margin-right: 16px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;"><br/></span></section><section style="white-space: normal;text-align: justify;line-height: 2em;margin-left: 16px;margin-right: 16px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">答疑环节也给大家准备了丰富用心的小礼品。</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">记得预约并加入自己的日程哦！</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">！</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">！</span></section><p style="white-space: normal;text-align: justify;line-height: 2em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;"><br/></span></p><section data-mpa-template="t" mpa-from-tpl="t"><section mpa-from-tpl="t"><section style="margin: 10px;display:flex;justify-content: center;align-items: center;" mpa-from-tpl="t"><section style="width:25px;flex-shrink: 0;" mpa-from-tpl="t"><img data-ratio="0.9047619047619048" class="rich_pages wxw-img" data-type="png" data-w="21" style="max-width: 100%;vertical-align: middle;" src="https://wechat2rss.xlab.app/img-proxy/?k=c1f92141&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FTN05MmJLxMrNiboff6rhmPUYUNXdWTXZfAc7MUrsbsC5xu0MqatyDtD1zOvjj8iak1KQwYPklbOqAxd3IPhGTEbg%2F640%3Fwx_fmt%3Dpng"/></section><section style="padding: 0px 8px;" mpa-from-tpl="t"><p style="margin: 0px;text-align: center;font-size: 15px;color: #f5ac5d;letter-spacing: 1.5px;">可在文末扫码加小助手进群交流哦~<br/></p></section><section style="width:25px;flex-shrink: 0;" mpa-from-tpl="t"><img class="rich_pages wxw-img" data-ratio="0.9047619047619048" style="max-width: 100%;vertical-align: middle;" data-type="png" data-w="21" src="https://wechat2rss.xlab.app/img-proxy/?k=5ed895cc&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQpDMIibF66u3xcmbFXTibvBwFaWcmmnnjjia7mHo1PlY9QEia5hBC786KwFymF9pIawU0JicEoob3hcHw%2F640%3Fwx_fmt%3Dpng"/></section></section></section></section><p style="text-align: center;"><img class="rich_pages wxw-img" data-galleryid="" data-ratio="1.7777777777777777" data-s="300,640" style="" data-type="png" data-w="1080" src="https://wechat2rss.xlab.app/img-proxy/?k=cfd309bf&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQpDMIibF66u3xcmbFXTibvBwCiaaskRswoSRMf900GNtO9my4Ij8eMbvq6xhcCu7pRaWJVqtBRdzwbA%2F640%3Fwx_fmt%3Dpng"/></p>



<p><a href="https://cloud.tencent.com/edu/learning/live-3538">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=49289381&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247488148%26idx%3D1%26sn%3Dba989e532922cc893b76748ddd35eca7%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 29 Nov 2021 12:05:00 +0800</pubDate>
    </item>
    <item>
      <title>无监督方法在UEBA行为分析中的应用与实践</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247488087&amp;idx=1&amp;sn=d4c955d251272f700da67ccbce41191f</link>
      <description></description>
      <content:encoded><![CDATA[<p>
原创 <span>御见UEBA团队</span> <span>2021-10-25 12:00</span> <span style="display: inline-block;"></span>
</p>

<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=ecd221aa&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavTjmEODXoMpZVrLUdv0bNTC3hNic3s2SRWz5jU8CrB5HNHtiaRGlgNTtuKMvSqiapjickaXRicfMzxwATw%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<section style="margin-left: 0em;margin-right: 0em;line-height: 1.5em;margin-top: 5px;" data-mpa-powered-by="yiban.io"><section style="margin-top: 8px;margin-bottom: -19px;display: flex;flex-flow: row nowrap;text-align: left;justify-content: flex-start;transform: translate3d(8px, 0px, 0px);"><section style="margin-right: -8px;display: inline-block;vertical-align: top;width: auto;height: auto;flex: 0 0 0%;align-self: flex-start;border-width: 0px;line-height: 0;z-index: 2;"><section powered-by="xiumi.us" style="transform: rotateZ(39deg);"><section style="margin-top: -7px;justify-content: flex-start;"><br/><span style="color: rgb(58, 58, 58);font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;font-size: 16px;cursor: pointer;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 563.5 950" aria-hidden="true" style="vertical-align: -0.452ex;width: 1.275ex;height: 2.149ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="934.6px" font-family="serif">ϕ</text></g></g></g></g></svg></span></section></section></section></section></section><section powered-by="xiumi.us" style="margin-bottom: 8px;margin-left: 0em;margin-right: 0em;"><section style="padding-right: 16px;padding-left: 16px;letter-spacing: 1.5px;"><p><br/></p><section data-mpa-template="t" mpa-from-tpl="t"><section style="margin: 27px 1em 16px;padding: 8px 1em;font-family: inherit;font-size: 16px;white-space: normal;color: rgb(0, 82, 255);background-color: rgb(255, 255, 255);text-decoration: inherit;line-height: 25.6px;border-width: 1px;border-style: solid;border-color: rgb(136, 136, 136);box-shadow: rgb(165, 165, 165) 5px 5px 2px;letter-spacing: 1px;" mpa-from-tpl="t"><section style="margin-top: -1.2em;margin-right: 0em;margin-left: 0em;color: rgb(0, 82, 255);font-size: 1em;border-width: initial;border-style: initial;border-color: currentcolor;line-height: 25.6px;" mpa-from-tpl="t"><span style="padding: 4px 8px;border-color: rgb(0, 82, 255);text-align: center;color: rgb(255, 255, 255);line-height: 1.4;font-family: inherit;font-size: 1em;text-decoration: inherit;display: inline-block;box-shadow: rgb(165, 165, 165) 4px 4px 2px;background-color: rgb(0, 82, 255);"><section style="margin-right: 0em;margin-left: 0em;" mpa-from-tpl="t"><strong mpa-from-tpl="t">导读</strong></section></span></section><section style="margin-right: 0em;margin-left: 0em;padding: 16px;font-family: inherit;" mpa-from-tpl="t"><span style="color: rgb(136, 136, 136);font-size: 14px;">      <strong>腾讯SOC+UEBA（用户实体行为分析）面向政企办公安全、数据安全治理、员工高危操作风险管理等领域</strong>。<strong>使用一系列分析方法（机器学习、无监督学习等）对用户实体画像进行风险检测和评估，以识别内部风险用户和风险实体。</strong><strong>支持对各类安全数据的智能分析与可视化展示，提供仪表板和风险时间线及工单告警能力，实现安全运营与管理闭环，让安全建设可感知可运营，赋能安全团队。</strong></span></section></section></section><p><br/></p></section></section><p style="text-align: center;"><img class="rich_pages wxw-img" data-fileid="100004425" data-galleryid="" data-ratio="0.5" data-s="300,640" style="" data-type="png" data-w="3304" src="https://wechat2rss.xlab.app/img-proxy/?k=7df19206&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQu0P6iahYhTwmeUjicK8NsH7BOL0eJGhE2Damom1Tzhibcss8H1LVNbSRFsTVAucMgV4cbkNGfc5DWg%2F640%3Fwx_fmt%3Dpng"/></p><section mpa-from-tpl="t" style="white-space: normal;color: rgb(62, 62, 62);letter-spacing: 2px;margin-left: 0em;margin-right: 0em;"><section data-id="20254" data-type="lspecial02,lspecial04" data-md5="5572a" mpa-from-tpl="t"><section mpa-from-tpl="t"><section data-id="92504" mpa-from-tpl="t"><section data-width="100%" mpa-from-tpl="t" style="margin-top: 15px;width: 578px;"><section data-width="100%" mpa-from-tpl="t" style="width: 578px;border-bottom: 1px solid rgb(51, 51, 51);"><br/></section><section data-width="100%" mpa-from-tpl="t" style="margin-top: -13px;width: 578px;text-align: center;"><section mpa-from-tpl="t" style="display: inline-block;background-color: rgb(254, 254, 254);width: 50px;"><img data-fileid="100004427" data-ratio="0.4025974025974026" style="width: 50px;vertical-align: middle;" data-type="png" data-w="77" data-width="100%" src="https://wechat2rss.xlab.app/img-proxy/?k=5bba1d0f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2Fb96CibCt70iaZ3RJbBOqR2SMibdF9Pu3I4FMIKhg5fGcPqwTbYe4YgyBrP0gpy5cZoGbovoialVSpWcpwFI1KKPBxw%2F640%3Fwx_fmt%3Dpng"/></section></section></section></section></section><section mpa-from-tpl="t"><section mpa-from-tpl="t"><section mpa-from-tpl="t" style="margin: 10px;display: flex;justify-content: center;align-items: center;"><section mpa-from-tpl="t" style="width: 25px;flex-shrink: 0;"><img data-fileid="100004429" data-ratio="0.9047619047619048" style="vertical-align: middle;" data-type="png" data-w="21" src="https://wechat2rss.xlab.app/img-proxy/?k=c1f92141&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FTN05MmJLxMrNiboff6rhmPUYUNXdWTXZfAc7MUrsbsC5xu0MqatyDtD1zOvjj8iak1KQwYPklbOqAxd3IPhGTEbg%2F640%3Fwx_fmt%3Dpng"/></section><section mpa-from-tpl="t" style="padding-right: 8px;padding-left: 8px;"><p style="text-align: center;font-size: 15px;color: rgb(86, 131, 218);letter-spacing: 1.5px;"><span style="font-size: 18px;font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);"><strong>本文目录</strong></span></p></section><section mpa-from-tpl="t" style="width: 25px;flex-shrink: 0;"><img data-fileid="100004428" data-ratio="0.9047619047619048" style="vertical-align: middle;" data-type="png" data-w="21" src="https://wechat2rss.xlab.app/img-proxy/?k=e00dc02d&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FSotDE9EOhAaC0djdfz7k9QtZfyooffwjBBAtanXe5DXDn1r2Ijg2iaxhZB9EvJsWjiafpMmxYAj5zcB84wdbGQTA%2F640%3Fwx_fmt%3Dpng"/></section></section></section></section></section></section><section mpa-from-tpl="t" style="white-space: normal;letter-spacing: 2px;margin-left: 0em;margin-right: 0em;"><section data-id="28144" data-type="lspecial04,lspecial02" mpa-from-tpl="t" style="font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;word-spacing: 2px;background-color: rgb(255, 255, 255);"><section mpa-from-tpl="t" style="color: rgb(62, 62, 62);margin-right: 10px;margin-bottom: -8px;display: -webkit-box;-webkit-box-pack: end;"><section mpa-from-tpl="t" style="width: 150px;transform: rotate(0deg);"><img class="__bg_gif" data-fileid="100004426" data-ratio="0.14285714285714285" style="vertical-align: bottom;width: 150px;visibility: visible !important;" data-type="gif" data-w="182" src="https://wechat2rss.xlab.app/img-proxy/?k=a0e8fe51&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FUS10Gcd0tQFoXSugtibHNS32ANo3VSsOE7JjE6P3Uhxya9oCVmicCicJN2EOd13QIoqHIwTmErmsTy30M9xT1YPYg%2F640%3Fwx_fmt%3Dgif"/></section></section><section mpa-from-tpl="t" style="border-width: 1px;border-style: solid;border-color: rgb(0, 0, 0);border-radius: 6px;"><section mpa-from-tpl="t" style="padding: 14px;"><section mpa-from-tpl="t" style="letter-spacing: 1px;line-height: 24px;"><p style="color: rgb(0, 0, 0);margin-right: 1em;margin-left: 1em;font-size: 14px;text-align: left;"><span style="color: rgb(255, 169, 0);"><strong>        一、背景挑战</strong></span></p><section style="color: rgb(0, 0, 0);margin-right: 1em;margin-left: 1em;font-size: 14px;text-align: left;margin-top: 10px;"><span style="color: rgb(255, 169, 0);"><strong>        二、算法介绍</strong></span></section><p style="color: rgb(0, 0, 0);margin-right: 1em;margin-left: 1em;font-size: 14px;text-align: left;"><span style="color: rgb(0, 82, 255);"><strong><strong>           2</strong>.1 整体思路</strong><br/></span></p><p style="color: rgb(0, 0, 0);margin-right: 1em;margin-left: 1em;font-size: 14px;text-align: left;"><span style="color: rgb(0, 82, 255);">           <strong>2</strong><strong>.2 正样本筛选</strong></span></p><p style="color: rgb(0, 0, 0);margin-right: 1em;margin-left: 1em;font-size: 14px;text-align: left;"><span style="color: rgb(0, 82, 255);"><strong><strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong>               2</strong>.2.1 特征构造</strong></strong></span></p><p style="margin-right: 1em;margin-left: 1em;font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 1px;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);color: rgb(0, 0, 0);font-size: 14px;text-align: left;"><span style="color: rgb(0, 82, 255);"><strong><strong>               2</strong>.2.2 孤立森林</strong></span></p><p style="color: rgb(0, 0, 0);margin-right: 1em;margin-left: 1em;font-size: 14px;text-align: left;"><span style="color: rgb(0, 82, 255);"><strong><strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong>           2</strong>.3 算法介绍</strong></strong></strong></span></p><p style="color: rgb(0, 0, 0);margin-right: 1em;margin-left: 1em;font-size: 14px;text-align: left;"><span style="color: rgb(0, 82, 255);"><strong><strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong>               2</strong>.3.1 VAE</strong></strong></strong></span></p><p style="color: rgb(0, 0, 0);margin-right: 1em;margin-left: 1em;font-size: 14px;text-align: left;"><span style="color: rgb(0, 82, 255);"><strong><strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong><strong>               2</strong>.3.2 <strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong>GANomaly</strong></strong></strong></strong></strong></strong></strong></span></p><section style="color: rgb(0, 0, 0);margin-right: 1em;margin-left: 1em;font-size: 14px;text-align: left;margin-top: 10px;"><span style="color: rgb(255, 169, 0);"><strong>        三、文末总结</strong></span></section></section></section></section><section mpa-from-tpl="t" style="color: rgb(62, 62, 62);margin-top: -14px;margin-right: 1em;margin-left: 1em;display: -webkit-box;"><section mpa-from-tpl="t" style="margin-right: 1em;margin-left: 1em;width: 150px;transform: rotate(0deg);"><img class="__bg_gif" data-fileid="100004430" data-ratio="0.14285714285714285" style="vertical-align: bottom;width: 150px;visibility: visible !important;" data-type="gif" data-w="182" src="https://wechat2rss.xlab.app/img-proxy/?k=6521f6c4&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_gif%2FUS10Gcd0tQFoXSugtibHNS32ANo3VSsOEicVEGOJLoBebJmXKPDHZOiaxUuqoYC88umibFUpLbx696SIZ1or1zibxNw%2F640%3Fwx_fmt%3Dgif"/></section></section></section></section><p style="margin-left: 0em;margin-right: 0em;"><br/></p><p style="margin-right: 0em;margin-left: 0em;white-space: normal;"><br mpa-from-tpl="t"/></p><section data-mpa-template="t" mpa-from-tpl="t" style="margin-right: 0em;margin-left: 0em;white-space: normal;"><section data-mid="" mpa-from-tpl="t" style="display: flex;justify-content: center;align-items: center;width: 578px;"><section data-mid="" mpa-from-tpl="t" style="display: flex;justify-content: center;align-items: center;"><section data-mid="" mpa-from-tpl="t" style="background: rgba(46, 86, 236, 0.3);"><section data-mid="" mpa-from-tpl="t" style="padding-right: 12px;padding-left: 12px;height: 38px;background: rgb(68, 104, 248);transform: translate(5px, -5px);display: flex;justify-content: center;align-items: center;"><section data-mid="" mpa-from-tpl="t" style="padding-right: 6px;padding-left: 6px;text-align: center;"><p data-mid="" style="font-size: 16px;font-family: PingFangSC-Semibold, &#34;PingFang SC&#34;;font-weight: bold;color: rgb(255, 255, 255);line-height: 22px;">一、背景挑战</p></section></section></section></section></section></section><section style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;margin-top: 15px;"><span style="font-size: 14px;">      </span><span style="font-size: 15px;"> 由网络产生的未知风险中，很大一部分来自于内部人员有意或无意的违规违纪行为，例如一些内部人员非法接入、业务数据窃取、私自外发等非常规行为泄露机密文件，传统以来静态规则的检测方法很难识别这些行为，即使能发现一些线索，也会淹没在海量信息中无法及时响应，导致难以追溯定责。</span></section><section style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><span style="font-size: 15px;">       为此，腾讯SOC使用UEBA技术围绕以人、设备为主体的行为范式，结合员工行为、群组的对等关系及数据使用情况进行用户实体的行为分析。当前UEBA用户行为异常分析中面临如下三大挑战:</span></section><ol class="list-paddingleft-2" style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><li style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><p style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><strong><span style="font-size: 15px;color: rgb(0, 82, 255);">真实异常样例少</span></strong><span style="font-size: 15px;">，由于内部员工越权访问涉密数据或者账号失陷用户攻击是小概率事件，可获取的真实异常事件样本极少;
正、负样本数量极不平衡，历史日志中绝大部分都是正常行为的数据，异常数据所占比例很小，不足以准确描绘异常的特征，无法直接从数据中学到所有异常的特性；</span></p></li><li style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><p style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><strong><span style="font-size: 15px;color: rgb(0, 82, 255);">数据标注困难</span></strong><span style="font-size: 15px;">：数据缺少标签，人工标记成本高，可操作性低；</span></p></li><li style="margin-right: 0em;margin-left: 0em;line-height: 2em;text-align: justify;"><p style="margin-right: 0em;margin-left: 0em;line-height: 2em;"><strong><span style="font-size: 15px;color: rgb(0, 82, 255);">攻击模式不确定</span></strong><span style="font-size: 15px;">：为了规避检测，攻击者可能会将其恶意的行为隐藏在正常的行为中，不易发现; 攻击策略没有固定模式，无法事先预知。</span></p></li></ol><p style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;margin-top: 10px;"><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">       有监督的方法依赖于准确标注好的数据集进行模型训练，需要充足的正、负样本，然而由于存在如前所述的”三大挑战“，有监督的方法无法发挥作用。因此，我们探索了一些无监督方法在UEBA中进行落地尝试，即VAE和GAN。相比于以往的异常检测方法，这些方法能捕捉用户的动态行为变化，能提高实际应用中的检测准确性。将样本的多维度特征进行评定，可以批量分析账户的异常行为，有助于自适应的持续算法<span style="font-size: 15px;">优化。</span></span></span></p><p style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;margin-top: 10px;"><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">       实际场景中多数是一些时序数据，需要通过算法的设计自动识别出海量日志数据中的异常样本。此外，场景中往往要检测实体的异常行为，并按其偏离程度排序，便于企业安全管理人员按优先级核实跟踪处理这些异常行为。</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">在UEBA中，很多场景都会用到无监督方法的预测、检测的相关技术，例如：</span></p><ul class="list-paddingleft-2" style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><li style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><p style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">针对主机安全、VPN、OA等日志，</span><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);"><strong>检测某个账号在主机或服务器的操作异常</strong></span><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">，如文件传输数据量是否异常、登录或访问行为等是否异常<br/></span></p></li><li style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><p style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">针对数据库审计日志，</span><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);"><strong>检测已授权用户对数据库访问是否异常</strong></span><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">，如越权访问、已授权数据的恶意更改、滥用或泄露行为</span></p></li><li style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><p style="margin-left: 0em;margin-right: 0em;line-height: 2em;text-align: justify;"><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">针对堡垒机、WEB应用防护等日志，</span><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);"><strong>检</strong><strong>测某个用户或账号访问的内网资源、API数量等是否有行为异常</strong></span></p></li></ul><section style="line-height: 2em;text-align: justify;margin-top: 10px;"><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;">        因此，我们在UEBA用户实体行为分析的落地实践中，对一些无监督方法做了一些探索与尝试。本文主要介绍<strong>VAE</strong>和</span><strong><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;">GAN</span></strong><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;">两种无监督学习的方法，由于其强大的能力成为异常检测任务的新秀，在学术和工业界受到广泛应用。</span></section><p style="margin-left: 0em;margin-right: 0em;"><span style="font-size: 14px;"><br/></span></p><section style="margin-left: 0em;margin-right: 0em;margin-top: 10px;"><section data-mid="" mpa-from-tpl="t" style="display: flex;justify-content: center;align-items: center;width: 578px;"><section data-mid="" mpa-from-tpl="t" style="display: flex;justify-content: center;align-items: center;"><section data-mid="" mpa-from-tpl="t" style="background: rgba(46, 86, 236, 0.3);"><section data-mid="" mpa-from-tpl="t" style="padding-right: 12px;padding-left: 12px;height: 38px;background: rgb(68, 104, 248);transform: translate(5px, -5px);display: flex;justify-content: center;align-items: center;"><section data-mid="" mpa-from-tpl="t" style="padding-right: 6px;padding-left: 6px;text-align: center;"><p data-mid="" style="font-size: 16px;font-family: PingFangSC-Semibold, &#34;PingFang SC&#34;;font-weight: bold;color: rgb(255, 255, 255);line-height: 22px;">二、算法介绍</p></section></section></section></section></section></section><p style="margin-left: 0em;margin-right: 0em;"><br/></p><section style="margin-left: 0em;margin-right: 0em;margin-top: 10px;"><br/></section><p style="margin-left: 0em;margin-right: 0em;"><span style="font-size: 15px;"><strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);">2.1 整体思路</strong></span><br/></p><section style="margin-left: 0em;margin-right: 0em;margin-top: 10px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;">       </span><span style="font-size: 15px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">首先我们对数据进行基本分析，使用</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);"><strong>协方差矩阵</strong></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">得到特征相关度并进行<strong>特征构造</strong>，并使用</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);"><strong>孤立森林</strong></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">从5w多无标签数据中挑选正常样本。其次，将筛选出的50%<strong>正常样本</strong>分别用以</span><strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">Ganomaly</span></strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">、</span><strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">VAE</span></strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">模型的训练，以构建<strong>用户实体行为基线</strong>和<strong>行为评价模型</strong>。然后，将其余数据或者测试集合输入至收敛后的评价模型进行异常分数的计算，得到用户或账号行为与基线距离的偏离程度，即异常程度。</span></span></section><p style="text-align: center;"><img class="rich_pages wxw-img" data-fileid="100004431" data-galleryid="" data-ratio="0.5256544502617801" data-s="300,640" style="" data-type="png" data-w="1910" src="https://wechat2rss.xlab.app/img-proxy/?k=c992292e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRyeDBrvRYMv4ZBiaV3t1R2R4JAew29m57oUGFFkUtueH7SLFia55Wpw9KE2uwicE7z4aSArfwULMRibQ%2F640%3Fwx_fmt%3Dpng"/></p><p style="margin-left: 0em;margin-right: 0em;margin-top: 10px;"><span style="font-size: 15px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">        VAE和GANonaly这两个模型做异常检测的假设都是一样的，即假定正常数据是服从某一种分布的，而异常数据是不能够拟合进这个分布，因此我们可以</span><strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">用VAE和GANomaly找到正常数据的分布</span></strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">，从而用这个分布来做异常检测。</span></span></p><section style="margin-left: 0em;margin-right: 0em;margin-top: 10px;"><strong style="color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;white-space: normal;word-spacing: 2px;background-color: rgb(255, 255, 255);">2.2 正样本筛选</strong></section><p style="margin: 10px 0em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;">       无监督学习是为了直接学习数据的分布，而不需要使用结果或者标签，其学习的是特征之间的关系，因此常被用于降维和聚类。由3.1节可知， 我们首先需要筛选一些靠谱的</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;color: rgb(0, 82, 255);"><strong>正样本</strong></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">，这里选择孤立森林进行区分。其次，为更好的了解特征间的关系，读者可以使用</span><strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">协方差矩阵</span></strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;">分析特征之间的相关度，并通过热力图可视化查看，关联度低的特征可以屏蔽掉。<span style="display: none;line-height: 0px;">‍‍‍</span>如有需要可额外自行构造一些有效特征。</span></span></p><p style="margin: 10px 0em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;">        热力图反映了数据本身的特征与其他构造特征的相关系数。颜色越深代表两个特征间呈强负相关，颜色越浅（淡白色）则两个特征之间呈强正相关。   </span></p><p style="margin: 10px 0em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;color: rgb(255, 76, 0);"><strong style="white-space: normal;color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong style="font-size: 14px;white-space: normal;color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 1px;text-align: left;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(255, 76, 0);">2.2.1  特征构造</strong></strong></strong></span></p><p style="margin: 10px 0em;"><span style="font-size: 15px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">        特征构造需要结合相应的安全场景进行分析，最好能明确企业的</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);"><strong>网络拓扑结构</strong></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">，办公网和生产网检测场景各有侧重点。针对账号登录、资源的访问等，根据时间，ip，部门等特征进行定义。比如可以人工定义一些</span><strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">基于时间的威胁等级特征</span></strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">。</span></span></p><p style="margin: 10px 0em;"><span style="font-size: 15px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">       在实际的业务场景</span></span><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;">中，员工ID在非工作时间段的行为本身存在一定危险系数，</span><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;">比如存在身份ID被盗用的可能。</span><span style="font-size: 15px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">可以指定凌晨1点~凌晨5点为高危时段。其次，基于</span><strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">群组标签</span></strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">也可以进行相关统计，账号使用过程中</span><strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">常用登录设备、常用访问资源、常用登录地点</span></strong><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">等，这些特征可以很好的辅助用户实体画像的构建和异常行为的检测。</span></span></p><p style="margin: 10px 0em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;"><strong style="font-size: 14px;white-space: normal;color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 1px;text-align: left;word-spacing: 2px;background-color: rgb(255, 255, 255);"><strong style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;white-space: normal;color: rgb(255, 76, 0);">2.2.2  孤立森林</strong></strong></span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">        孤立森林（Isolation Forest）基于 Ensemble 的异常检测方法，凭借其线性的时间复杂度且精准度较高，在处理大数据时速度快，所以被广泛应用于工业界中结构化数据的异常检测。常见的场景包括：网络安全中的攻击检测、金融交易欺诈检测、疾病侦测、噪声数据过滤（数据清洗）等。</span></p><p style="text-align: center;"><img class="rich_pages wxw-img" data-fileid="100004433" data-galleryid="" data-ratio="0.37662337662337664" data-s="300,640" style="width: 517px;height: 195px;" data-type="png" data-w="770" src="https://wechat2rss.xlab.app/img-proxy/?k=b91ac30d&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRyeDBrvRYMv4ZBiaV3t1R2RpLMCYA3QnmicoMOlQWSBZdp96fYxiaPBv1IsKbNmcODJfXMMnAZzOoxg%2F640%3Fwx_fmt%3Dpng"/></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">孤立森林的使用需要有一些理论基础：</span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-size: 15px;">    <span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">1、异常数据占总样本量的比例很小；</span></span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-size: 15px;">    <span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">2、异常点的特征值与正常点的差异很大。</span></span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">       由于算法的设计，孤立森林有以下优点。由于每棵树都是独立的，因此在分布式的系统中加速计算；此外不同于聚类算法找到异常点，它不需要计算点与点之间的距离或者簇的密度，模型为线性时间的复杂度，速度快，系统开销小。</span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">Tips：</span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-size: 15px;">1、<span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">训练样本中</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">异常样本的比例</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">不宜过高，可能会导致最终结果不理想，因为这违背了该算法的理论基础。因此，其适用于UEBA中常用户行为的检测。<br/></span></span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-size: 15px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">2、训练样本</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">特征维度</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">不宜过高，<span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">因为当树的样本量确定之后，树的高度确定了。当样本维度较高时，会存在建完树之后仍有大量的特征信息未被使用，从而导致了算法的准确性。并且高维样本空间中可能会存在一些无关的维度或者噪音维度，这些也会对树的构建产生影响。因此</span></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);">在使用孤立森林前，需要对业务数据中一些噪音或无效特征进行甄别和过滤</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">。</span></span></p><p style="text-align: justify;"><br/></p><p style="margin-left: 0em;margin-right: 0em;"><strong style="white-space: normal;color: rgb(0, 82, 255);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;letter-spacing: 1px;text-align: left;word-spacing: 2px;background-color: rgb(255, 255, 255);">2.3 算法介绍</strong></p><section style="text-align: justify;margin-top: 10px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">        2.2章节中我们使用孤立森林挑选出50%的正常数据供本章介绍的模型使用。用这两个模型做异常检测的假设都是一样的，即假定正常数据是服从某一种分布的，而异常数据是不能够拟合进这个分布，因此我们可以用VAE和GAN来找到正常数据的分布，从而用这个分布来做行为异常检测。</span></section><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-size: 14px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;"><strong style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;white-space: normal;font-size: 14px;color: rgb(255, 76, 0);">2.3.1  VAE（Variational Autoencoder)</strong></span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;">       </span><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">VAE是变分自编码器的简称，该模型最开始提出的目的是为了找到训练数据的分布，从而用这个分布来生成数据。</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">从另一个角度而言，如果我们能够找到正常数据的分布，那么我们就可以用这个分布来做异常检测。</span></p><section style="white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;color: rgb(0, 82, 255);">那么VAE是如何检测出异常点呢？</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">这里先简单进行概括，对算法感兴趣的读者可以在本小节末尾查看详细内容。</span></section><ol class="list-paddingleft-2" style="list-style-type: decimal;"><li><p style="white-space: normal;line-height: 1.75em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">先用正常样本去训练VAE模型</span></p></li><li><p style="white-space: normal;line-height: 1.75em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">输入测试集给VAE，获得重构的测试集数据</span></p></li><li><section style="white-space: normal;line-height: 1.75em;margin-bottom: 10px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">计算重构的数据和原始数据的误差，若重构误差大于某个阈值，则认为样本异常   </span></section></li></ol><section style="white-space: normal;margin-bottom: 10px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">其原理是：输入一个序列，得到一个隐变量（从隐变量的分布中采样得到），然后将隐变量重构成原始输入。其中，VAE学习到的是隐变量的分布(允许隐变量存在一定的噪声和随机性)，因此可以具有类似</span><span style="color: rgb(0, 82, 255);font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">正则化防止过拟合的作用</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">。下图表示了VAE的整个过程。首先通过Encoder得到 x的隐变量分布参数；然后采样得到隐变量z。接下来利用 Decoder 求得x的分布参数，而实际中一般就直接利用隐变量恢复x。</span></section><p style="text-align: center;"><img class="rich_pages wxw-img" data-fileid="100004432" data-galleryid="" data-ratio="0.12987012987012986" data-s="300,640" style="" data-type="png" data-w="616" src="https://wechat2rss.xlab.app/img-proxy/?k=508fdd37&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRyeDBrvRYMv4ZBiaV3t1R2RNVBgPiaiatFXM3NsWg5ZuRsK6SibgoUwqvR0JlyPTEDw4AJByueR0R0sA%2F640%3Fwx_fmt%3Dpng"/></p><p><br/></p><hr style="border-style: solid;border-width: 1px 0 0;border-color: rgba(0,0,0,0.1);-webkit-transform-origin: 0 0;-webkit-transform: scale(1, 0.5);transform-origin: 0 0;transform: scale(1, 0.5);"/><section style="white-space: normal;margin-bottom: 10px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">VAE检测异常点的算法过程如下所示：</span></section><section data-tool="markdown编辑器" data-website="https://markdown.com.cn/editor" style="white-space: normal;margin-bottom: 10px;"><ul data-tool="markdown.com.cn编辑器" style="white-space: normal;margin-bottom: 10px;" class="list-paddingleft-2"><li style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;line-height: 1.5em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">使用正常数据进行训练，训练过程中 decoder 和 encoder 共同确定隐变量的参数（即多个正态分布的</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -431 571 442" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.292ex;height: 1ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 和</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 603 658" aria-hidden="true" style="vertical-align: -0.489ex;width: 1.364ex;height: 1.489ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3BC" d="M58 -216Q44 -216 34 -208T23 -186Q23 -176 96 116T173 414Q186 442 219 442Q231 441 239 435T249 423T251 413Q251 401 220 279T187 142Q185 131 185 107V99Q185 26 252 26Q261 26 270 27T287 31T302 38T315 45T327 55T338 65T348 77T356 88T365 100L372 110L408 253Q444 395 448 404Q461 431 491 431Q504 431 512 424T523 412T525 402L449 84Q448 79 448 68Q448 43 455 35T476 26Q485 27 496 35Q517 55 537 131Q543 151 547 152Q549 153 557 153H561Q580 153 580 144Q580 138 575 117T555 63T523 13Q510 0 491 -8Q483 -10 467 -10Q446 -10 429 -4T402 11T385 29T376 44T374 51L368 45Q362 39 350 30T324 12T288 -4T246 -11Q199 -11 153 12L129 -85Q108 -167 104 -180T92 -202Q76 -216 58 -216Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">）。</span></section></section></li><li style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;line-height: 1.5em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">对于</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 888 683" aria-hidden="true" style="vertical-align: 0px;width: 2.009ex;height: 1.545ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="4E" d="M234 637Q231 637 226 637Q201 637 196 638T191 649Q191 676 202 682Q204 683 299 683Q376 683 387 683T401 677Q612 181 616 168L670 381Q723 592 723 606Q723 633 659 637Q635 637 635 648Q635 650 637 660Q641 676 643 679T653 683Q656 683 684 682T767 680Q817 680 843 681T873 682Q888 682 888 672Q888 650 880 642Q878 637 858 637Q787 633 769 597L620 7Q618 0 599 0Q585 0 582 2Q579 5 453 305L326 604L261 344Q196 88 196 79Q201 46 268 46H278Q284 41 284 38T282 19Q278 6 272 0H259Q228 2 151 2Q123 2 100 2T63 2T46 1Q31 1 31 10Q31 14 34 26T39 40Q41 46 62 46Q130 49 150 85Q154 91 221 362L289 634Q287 635 234 637Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 个测试数据循环遍历，对于每个测试数据</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 866 599.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 1.959ex;height: 1.357ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mi" transform="translate(572, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 操作如下：</span></section></section></li><ul style="white-space: normal;margin-bottom: 10px;list-style-type: square;" class="list-paddingleft-2"><li style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;line-height: 1.5em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">对于每个测试数据</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 866 599.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 1.959ex;height: 1.357ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mi" transform="translate(572, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">，通过训练好的 VAE 模型得到</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2104.8 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 4.762ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3BC" d="M58 -216Q44 -216 34 -208T23 -186Q23 -176 96 116T173 414Q186 442 219 442Q231 441 239 435T249 423T251 413Q251 401 220 279T187 142Q185 131 185 107V99Q185 26 252 26Q261 26 270 27T287 31T302 38T315 45T327 55T338 65T348 77T356 88T365 100L372 110L408 253Q444 395 448 404Q461 431 491 431Q504 431 512 424T523 412T525 402L449 84Q448 79 448 68Q448 43 455 35T476 26Q485 27 496 35Q517 55 537 131Q543 151 547 152Q549 153 557 153H561Q580 153 580 144Q580 138 575 117T555 63T523 13Q510 0 491 -8Q483 -10 467 -10Q446 -10 429 -4T402 11T385 29T376 44T374 51L368 45Q362 39 350 30T324 12T288 -4T246 -11Q199 -11 153 12L129 -85Q108 -167 104 -180T92 -202Q76 -216 58 -216Z"></path></g><g data-mml-node="mi" transform="translate(603, -150) scale(0.707)"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g><g data-mml-node="mo" transform="translate(981.8, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1370.8, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1715.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 和</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 1694 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 3.833ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g><g data-mml-node="mo" transform="translate(571, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(960, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1305, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">。</span></section></section></li><li style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;line-height: 1.5em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">根据</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2104.8 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 4.762ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3BC" d="M58 -216Q44 -216 34 -208T23 -186Q23 -176 96 116T173 414Q186 442 219 442Q231 441 239 435T249 423T251 413Q251 401 220 279T187 142Q185 131 185 107V99Q185 26 252 26Q261 26 270 27T287 31T302 38T315 45T327 55T338 65T348 77T356 88T365 100L372 110L408 253Q444 395 448 404Q461 431 491 431Q504 431 512 424T523 412T525 402L449 84Q448 79 448 68Q448 43 455 35T476 26Q485 27 496 35Q517 55 537 131Q543 151 547 152Q549 153 557 153H561Q580 153 580 144Q580 138 575 117T555 63T523 13Q510 0 491 -8Q483 -10 467 -10Q446 -10 429 -4T402 11T385 29T376 44T374 51L368 45Q362 39 350 30T324 12T288 -4T246 -11Q199 -11 153 12L129 -85Q108 -167 104 -180T92 -202Q76 -216 58 -216Z"></path></g><g data-mml-node="mi" transform="translate(603, -150) scale(0.707)"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g><g data-mml-node="mo" transform="translate(981.8, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1370.8, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1715.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 和 </span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 1694 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 3.833ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g><g data-mml-node="mo" transform="translate(571, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(960, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1305, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 得到关于</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 465 453" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.052ex;height: 1.025ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 的正态分布</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 6288.3 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 14.227ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="4E" d="M234 637Q231 637 226 637Q201 637 196 638T191 649Q191 676 202 682Q204 683 299 683Q376 683 387 683T401 677Q612 181 616 168L670 381Q723 592 723 606Q723 633 659 637Q635 637 635 648Q635 650 637 660Q641 676 643 679T653 683Q656 683 684 682T767 680Q817 680 843 681T873 682Q888 682 888 672Q888 650 880 642Q878 637 858 637Q787 633 769 597L620 7Q618 0 599 0Q585 0 582 2Q579 5 453 305L326 604L261 344Q196 88 196 79Q201 46 268 46H278Q284 41 284 38T282 19Q278 6 272 0H259Q228 2 151 2Q123 2 100 2T63 2T46 1Q31 1 31 10Q31 14 34 26T39 40Q41 46 62 46Q130 49 150 85Q154 91 221 362L289 634Q287 635 234 637Z"></path></g><g data-mml-node="mo" transform="translate(888, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="msub" transform="translate(1277, 0)"><g data-mml-node="mi"><path data-c="3BC" d="M58 -216Q44 -216 34 -208T23 -186Q23 -176 96 116T173 414Q186 442 219 442Q231 441 239 435T249 423T251 413Q251 401 220 279T187 142Q185 131 185 107V99Q185 26 252 26Q261 26 270 27T287 31T302 38T315 45T327 55T338 65T348 77T356 88T365 100L372 110L408 253Q444 395 448 404Q461 431 491 431Q504 431 512 424T523 412T525 402L449 84Q448 79 448 68Q448 43 455 35T476 26Q485 27 496 35Q517 55 537 131Q543 151 547 152Q549 153 557 153H561Q580 153 580 144Q580 138 575 117T555 63T523 13Q510 0 491 -8Q483 -10 467 -10Q446 -10 429 -4T402 11T385 29T376 44T374 51L368 45Q362 39 350 30T324 12T288 -4T246 -11Q199 -11 153 12L129 -85Q108 -167 104 -180T92 -202Q76 -216 58 -216Z"></path></g><g data-mml-node="mi" transform="translate(603, -150) scale(0.707)"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g><g data-mml-node="mo" transform="translate(2258.8, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(2647.8, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(2992.8, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(3381.8, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="msub" transform="translate(3826.5, 0)"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g><g data-mml-node="mi" transform="translate(571, -150) scale(0.707)"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g><g data-mml-node="mo" transform="translate(4776.3, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(5165.3, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(5510.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(5899.3, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">，从中抽取样本</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 681 683" aria-hidden="true" style="vertical-align: 0px;width: 1.541ex;height: 1.545ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="4C" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 217 683Q271 680 344 680Q485 680 506 683H518Q524 677 524 674T522 656Q517 641 513 637H475Q406 636 394 628Q387 624 380 600T313 336Q297 271 279 198T252 88L243 52Q243 48 252 48T311 46H328Q360 46 379 47T428 54T478 72T522 106T564 161Q580 191 594 228T611 270Q616 273 628 273H641Q647 264 647 262T627 203T583 83T557 9Q555 4 553 3T537 0T494 -1Q483 -1 418 -1T294 0H116Q32 0 32 10Q32 17 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">。</span></section></section></li></ul><li style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;line-height: 1.5em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">对于抽取样本</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 681 683" aria-hidden="true" style="vertical-align: 0px;width: 1.541ex;height: 1.545ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="4C" d="M228 637Q194 637 192 641Q191 643 191 649Q191 673 202 682Q204 683 217 683Q271 680 344 680Q485 680 506 683H518Q524 677 524 674T522 656Q517 641 513 637H475Q406 636 394 628Q387 624 380 600T313 336Q297 271 279 198T252 88L243 52Q243 48 252 48T311 46H328Q360 46 379 47T428 54T478 72T522 106T564 161Q580 191 594 228T611 270Q616 273 628 273H641Q647 264 647 262T627 203T583 83T557 9Q555 4 553 3T537 0T494 -1Q483 -1 418 -1T294 0H116Q32 0 32 10Q32 17 34 24Q39 43 44 45Q48 46 59 46H65Q92 46 125 49Q139 52 144 61Q147 65 216 339T285 628Q285 635 228 637Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 中的每一个数据</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -893.3 1716.4 904.3" aria-hidden="true" style="vertical-align: -0.025ex;width: 3.883ex;height: 2.046ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msup"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="TeXAtom" transform="translate(465, 363) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(734, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1012, 0)"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g><g data-mml-node="mo" transform="translate(1310, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">，关于</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -694 298 705" aria-hidden="true" style="vertical-align: -0.025ex;width: 0.674ex;height: 1.595ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 的循环：</span></section></section></li><ul style="white-space: normal;margin-bottom: 10px;list-style-type: square;" class="list-paddingleft-2"><li style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;line-height: 1.5em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">进行 decode 操作，得到</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -765 572 776" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.294ex;height: 1.756ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, -29)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">，这里可能是为了表示</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 1679 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 3.799ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3BC" d="M58 -216Q44 -216 34 -208T23 -186Q23 -176 96 116T173 414Q186 442 219 442Q231 441 239 435T249 423T251 413Q251 401 220 279T187 142Q185 131 185 107V99Q185 26 252 26Q261 26 270 27T287 31T302 38T315 45T327 55T338 65T348 77T356 88T365 100L372 110L408 253Q444 395 448 404Q461 431 491 431Q504 431 512 424T523 412T525 402L449 84Q448 79 448 68Q448 43 455 35T476 26Q485 27 496 35Q517 55 537 131Q543 151 547 152Q549 153 557 153H561Q580 153 580 144Q580 138 575 117T555 63T523 13Q510 0 491 -8Q483 -10 467 -10Q446 -10 429 -4T402 11T385 29T376 44T374 51L368 45Q362 39 350 30T324 12T288 -4T246 -11Q199 -11 153 12L129 -85Q108 -167 104 -180T92 -202Q76 -216 58 -216Z"></path></g><g data-mml-node="mo" transform="translate(603, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(992, 0)"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g><g data-mml-node="mo" transform="translate(1290, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">、</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 1647 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 3.726ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g><g data-mml-node="mo" transform="translate(571, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(960, 0)"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g><g data-mml-node="mo" transform="translate(1258, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 与</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -765 1695 1015" aria-hidden="true" style="vertical-align: -0.566ex;width: 3.835ex;height: 2.296ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, -29)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g><g data-mml-node="mo" transform="translate(572, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(961, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(1306, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 的关系，记作</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2923.1 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 6.613ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3BC" d="M58 -216Q44 -216 34 -208T23 -186Q23 -176 96 116T173 414Q186 442 219 442Q231 441 239 435T249 423T251 413Q251 401 220 279T187 142Q185 131 185 107V99Q185 26 252 26Q261 26 270 27T287 31T302 38T315 45T327 55T338 65T348 77T356 88T365 100L372 110L408 253Q444 395 448 404Q461 431 491 431Q504 431 512 424T523 412T525 402L449 84Q448 79 448 68Q448 43 455 35T476 26Q485 27 496 35Q517 55 537 131Q543 151 547 152Q549 153 557 153H561Q580 153 580 144Q580 138 575 117T555 63T523 13Q510 0 491 -8Q483 -10 467 -10Q446 -10 429 -4T402 11T385 29T376 44T374 51L368 45Q362 39 350 30T324 12T288 -4T246 -11Q199 -11 153 12L129 -85Q108 -167 104 -180T92 -202Q76 -216 58 -216Z"></path></g><g data-mml-node="TeXAtom" transform="translate(603, -187.3) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, -29)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1057.5, 0)"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(734, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1178.7, 0)"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g><g data-mml-node="mo" transform="translate(1476.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">和</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2891.1 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 6.541ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g><g data-mml-node="TeXAtom" transform="translate(571, -187.3) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, -29)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1025.5, 0)"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(734, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1178.7, 0)"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g><g data-mml-node="mo" transform="translate(1476.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></g></svg></section></section></li><li style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;line-height: 1.5em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">循环结束后得到多个</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2923.1 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 6.613ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3BC" d="M58 -216Q44 -216 34 -208T23 -186Q23 -176 96 116T173 414Q186 442 219 442Q231 441 239 435T249 423T251 413Q251 401 220 279T187 142Q185 131 185 107V99Q185 26 252 26Q261 26 270 27T287 31T302 38T315 45T327 55T338 65T348 77T356 88T365 100L372 110L408 253Q444 395 448 404Q461 431 491 431Q504 431 512 424T523 412T525 402L449 84Q448 79 448 68Q448 43 455 35T476 26Q485 27 496 35Q517 55 537 131Q543 151 547 152Q549 153 557 153H561Q580 153 580 144Q580 138 575 117T555 63T523 13Q510 0 491 -8Q483 -10 467 -10Q446 -10 429 -4T402 11T385 29T376 44T374 51L368 45Q362 39 350 30T324 12T288 -4T246 -11Q199 -11 153 12L129 -85Q108 -167 104 -180T92 -202Q76 -216 58 -216Z"></path></g><g data-mml-node="TeXAtom" transform="translate(603, -187.3) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, -29)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1057.5, 0)"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(734, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1178.7, 0)"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g><g data-mml-node="mo" transform="translate(1476.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"> 和</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2891.1 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 6.541ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="3C3" d="M184 -11Q116 -11 74 34T31 147Q31 247 104 333T274 430Q275 431 414 431H552Q553 430 555 429T559 427T562 425T565 422T567 420T569 416T570 412T571 407T572 401Q572 357 507 357Q500 357 490 357T476 358H416L421 348Q439 310 439 263Q439 153 359 71T184 -11ZM361 278Q361 358 276 358Q152 358 115 184Q114 180 114 178Q106 141 106 117Q106 67 131 47T188 26Q242 26 287 73Q316 103 334 153T356 233T361 278Z"></path></g><g data-mml-node="TeXAtom" transform="translate(571, -187.3) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, -29)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g></g></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1025.5, 0)"><g data-mml-node="mo"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(389, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(734, 0)"><path data-c="2C" d="M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z"></path></g><g data-mml-node="mi" transform="translate(1178.7, 0)"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g><g data-mml-node="mo" transform="translate(1476.7, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">. 其实就是多个</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -765 572 776" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.294ex;height: 1.756ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, -29)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">;</span></section></section></li></ul><li><section data-tool="markdown编辑器" data-website="https://markdown.com.cn/editor" style="font-size: 16px;color: black;padding: 25px 30px;line-height: 1.6;letter-spacing: 0px;word-break: break-word;font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;margin-top: -10px;"><section style="line-height: 1.8em;color: rgb(58, 58, 58);margin-bottom: 5px;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">通过多个</span><span style="cursor: pointer;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -765 866 922.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 1.959ex;height: 2.088ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mover"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(63.8, -29)"><path data-c="5E" d="M112 560L249 694L257 686Q387 562 387 560L361 531Q359 532 303 581L250 627L195 580Q182 569 169 557T148 538L140 532Q138 530 125 546L112 560Z"></path></g></g></g><g data-mml-node="mi" transform="translate(572, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g></svg></span> <span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">与训练好的 VAE 模型生成原来的测试数据</span><span style="cursor: pointer;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 866 599.8" aria-hidden="true" style="vertical-align: -0.357ex;width: 1.959ex;height: 1.357ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mi" transform="translate(572, -150) scale(0.707)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g></g></g></g></svg></span>，<span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">并计算重构概率（reconstruction probability）。这里计算的重构概率是对</span><span style="cursor: pointer;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 7642.2 1151.7" aria-hidden="true" style="vertical-align: -0.909ex;width: 17.29ex;height: 2.606ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="45" d="M492 213Q472 213 472 226Q472 230 477 250T482 285Q482 316 461 323T364 330H312Q311 328 277 192T243 52Q243 48 254 48T334 46Q428 46 458 48T518 61Q567 77 599 117T670 248Q680 270 683 272Q690 274 698 274Q718 274 718 261Q613 7 608 2Q605 0 322 0H133Q31 0 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H757Q764 676 764 669Q764 664 751 557T737 447Q735 440 717 440H705Q698 445 698 453L701 476Q704 500 704 528Q704 558 697 578T678 609T643 625T596 632T532 634H485Q397 633 392 631Q388 629 386 622Q385 619 355 499T324 377Q347 376 372 376H398Q464 376 489 391T534 472Q538 488 540 490T557 493Q562 493 565 493T570 492T572 491T574 487T577 483L544 351Q511 218 508 216Q505 213 492 213Z"></path></g><g data-mml-node="TeXAtom" transform="translate(738, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="msub"><g data-mml-node="mi"><path data-c="71" d="M33 157Q33 258 109 349T280 441Q340 441 372 389Q373 390 377 395T388 406T404 418Q438 442 450 442Q454 442 457 439T460 434Q460 425 391 149Q320 -135 320 -139Q320 -147 365 -148H390Q396 -156 396 -157T393 -175Q389 -188 383 -194H370Q339 -192 262 -192Q234 -192 211 -192T174 -192T157 -193Q143 -193 143 -185Q143 -182 145 -170Q149 -154 152 -151T172 -148Q220 -148 230 -141Q238 -136 258 -53T279 32Q279 33 272 29Q224 -10 172 -10Q117 -10 75 30T33 157ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z"></path></g><g data-mml-node="TeXAtom" transform="translate(446, -176.7) scale(0.707)" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="934.6px" font-family="serif">φ</text></g></g></g><g data-mml-node="mo" transform="translate(821.1, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1210.1, 0)"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="mo" transform="translate(1675.1, 0)"><path data-c="7C" d="M139 -249H137Q125 -249 119 -235V251L120 737Q130 750 139 750Q152 750 159 735V-235Q151 -249 141 -249H139Z"></path></g><g data-mml-node="mi" transform="translate(1953.1, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(2525.1, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g><g data-mml-node="mo" transform="translate(2848.6, 0)"><path data-c="5B" d="M118 -250V750H255V710H158V-210H255V-250H118Z"></path></g><g data-mml-node="mi" transform="translate(3126.6, 0)"><path data-c="6C" d="M117 59Q117 26 142 26Q179 26 205 131Q211 151 215 152Q217 153 225 153H229Q238 153 241 153T246 151T248 144Q247 138 245 128T234 90T214 43T183 6T137 -11Q101 -11 70 11T38 85Q38 97 39 102L104 360Q167 615 167 623Q167 626 166 628T162 632T157 634T149 635T141 636T132 637T122 637Q112 637 109 637T101 638T95 641T94 647Q94 649 96 661Q101 680 107 682T179 688Q194 689 213 690T243 693T254 694Q266 694 266 686Q266 675 193 386T118 83Q118 81 118 75T117 65V59Z"></path></g><g data-mml-node="mi" transform="translate(3424.6, 0)"><path data-c="6F" d="M201 -11Q126 -11 80 38T34 156Q34 221 64 279T146 380Q222 441 301 441Q333 441 341 440Q354 437 367 433T402 417T438 387T464 338T476 268Q476 161 390 75T201 -11ZM121 120Q121 70 147 48T206 26Q250 26 289 58T351 142Q360 163 374 216T388 308Q388 352 370 375Q346 405 306 405Q243 405 195 347Q158 303 140 230T121 120Z"></path></g><g data-mml-node="mi" transform="translate(3909.6, 0)"><path data-c="67" d="M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z"></path></g><g data-mml-node="msub" transform="translate(4386.6, 0)"><g data-mml-node="mi"><path data-c="70" d="M23 287Q24 290 25 295T30 317T40 348T55 381T75 411T101 433T134 442Q209 442 230 378L240 387Q302 442 358 442Q423 442 460 395T497 281Q497 173 421 82T249 -10Q227 -10 210 -4Q199 1 187 11T168 28L161 36Q160 35 139 -51T118 -138Q118 -144 126 -145T163 -148H188Q194 -155 194 -157T191 -175Q188 -187 185 -190T172 -194Q170 -194 161 -194T127 -193T65 -192Q-5 -192 -24 -194H-32Q-39 -187 -39 -183Q-37 -156 -26 -148H-6Q28 -147 33 -136Q36 -130 94 103T155 350Q156 355 156 364Q156 405 131 405Q109 405 94 377T71 316T59 280Q57 278 43 278H29Q23 284 23 287ZM178 102Q200 26 252 26Q282 26 310 49T356 107Q374 141 392 215T411 325V331Q411 405 350 405Q339 405 328 402T306 393T286 380T269 365T254 350T243 336T235 326L232 322Q232 321 229 308T218 264T204 212Q178 106 178 102Z"></path></g><g data-mml-node="mi" transform="translate(503, -150) scale(0.707)"><path data-c="3B8" d="M35 200Q35 302 74 415T180 610T319 704Q320 704 327 704T339 705Q393 701 423 656Q462 596 462 495Q462 380 417 261T302 66T168 -10H161Q125 -10 99 10T60 63T41 130T35 200ZM383 566Q383 668 330 668Q294 668 260 623T204 521T170 421T157 371Q206 370 254 370L351 371Q352 372 359 404T375 484T383 566ZM113 132Q113 26 166 26Q181 26 198 36T239 74T287 161T335 307L340 324H145Q145 321 136 286T120 208T113 132Z"></path></g></g><g data-mml-node="mo" transform="translate(5271.2, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(5660.2, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(6232.2, 0)"><path data-c="7C" d="M139 -249H137Q125 -249 119 -235V251L120 737Q130 750 139 750Q152 750 159 735V-235Q151 -249 141 -249H139Z"></path></g><g data-mml-node="mi" transform="translate(6510.2, 0)"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="mo" transform="translate(6975.2, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(7364.2, 0)"><path data-c="5D" d="M22 710V750H159V-250H22V-210H119V710H22Z"></path></g></g></g></svg></span> <span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">的 蒙特卡罗估计(Monte Carloe stimate)，当数据的重构概率很高时被归类为异常</span></section></section></li></ul></section><p style="margin-right: 0em;margin-left: 0em;white-space: normal;margin-top: 5px;"><span style="font-size: 14px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;"><strong style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;white-space: normal;color: rgb(255, 76, 0);">2.3.2 GANomaly</strong><strong style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;white-space: normal;font-size: 14px;color: rgb(255, 76, 0);"></strong></span></p><section style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;line-height: 1.75em;"><span style="display: none;line-height: 0px;">‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;">        </span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">GAN做异常检测的原理和VAE是一样的，只不过这两者得到正常数据的分布的方式不同，VAE通过变分推断来得到训练数据的分布，而GAN直接使用生成器来模拟数据的分布，用判别器来判定生成器模拟的分布的好坏。本文使用GAN的变种即GANomaly模型进行训练。</span></section><section style="white-space: normal;margin-bottom: 10px;line-height: 1.75em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">       GANomaly 以编码器-解码器-编码器设计模型，通过对比编码得到的潜在变量和重构编码得到的潜在变量差异，从而判断是否为</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">异常</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">样本。其能够</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">在无异常样本去训练模型的情况下实现异常的检测，对于很多场景都有很强的实际应用意义。模型结构图如下：</span></section><p style="text-align: center;"><img class="rich_pages wxw-img" data-fileid="100004434" data-galleryid="" data-ratio="0.505091649694501" data-s="300,640" style="" data-type="png" data-w="982" src="https://wechat2rss.xlab.app/img-proxy/?k=11ab19d5&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRyeDBrvRYMv4ZBiaV3t1R2RLRy1X9PXVhQ5mT6sUOW7OhdH4zRdl3ELmicrc2P6BXFQh9fretHSVIQ%2F640%3Fwx_fmt%3Dpng"/></p><section data-tool="markdown编辑器" data-website="https://markdown.com.cn/editor" style="white-space: normal;margin-bottom: 10px;"><section style="white-space: normal;margin-bottom: 10px;line-height: 1.75em;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;color: rgb(0, 82, 255);">那么使用GANomaly如何检测异常样本呢？</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">整体思路如下：</span></section><section data-tool="markdown编辑器" data-website="https://markdown.com.cn/editor" style="white-space: normal;line-height: 1.75em;"><p data-tool="markdown.com.cn编辑器" style="white-space: normal;line-height: 1.75em;"><span style="caret-color: rgba(0, 0, 0, 0.8);color: rgba(0, 0, 0, 0.8);font-family: 微软雅黑, HelveticaNeue-Light, &#34;Helvetica Neue Light&#34;, &#34;Helvetica Neue&#34;, Helvetica, Arial, sans-serif;font-size: 15px;letter-spacing: 1px;text-align: start;text-size-adjust: auto;background-color: rgb(255, 255, 255);">      </span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">在训练阶段，整个模型均是通过正常样本做训练。也就是编码器</span><span style="color: rgb(58, 58, 58);font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;font-size: 16px;letter-spacing: 0px;cursor: pointer;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2900 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 6.561ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="47" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q492 659 471 656T418 643T357 615T294 567T236 496T189 394T158 260Q156 242 156 221Q156 173 170 136T206 79T256 45T308 28T353 24Q407 24 452 47T514 106Q517 114 529 161T541 214Q541 222 528 224T468 227H431Q425 233 425 235T427 254Q431 267 437 273H454Q494 271 594 271Q634 271 659 271T695 272T707 272Q721 272 721 263Q721 261 719 249Q714 230 709 228Q706 227 694 227Q674 227 653 224Q646 221 643 215T629 164Q620 131 614 108Q589 6 586 3Q584 1 581 1Q571 1 553 21T530 52Q530 53 528 52T522 47Q448 -22 322 -22Q201 -22 126 55T50 252Z"></path></g><g data-mml-node="mi" transform="translate(786, 0)"><path data-c="45" d="M492 213Q472 213 472 226Q472 230 477 250T482 285Q482 316 461 323T364 330H312Q311 328 277 192T243 52Q243 48 254 48T334 46Q428 46 458 48T518 61Q567 77 599 117T670 248Q680 270 683 272Q690 274 698 274Q718 274 718 261Q613 7 608 2Q605 0 322 0H133Q31 0 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H757Q764 676 764 669Q764 664 751 557T737 447Q735 440 717 440H705Q698 445 698 453L701 476Q704 500 704 528Q704 558 697 578T678 609T643 625T596 632T532 634H485Q397 633 392 631Q388 629 386 622Q385 619 355 499T324 377Q347 376 372 376H398Q464 376 489 391T534 472Q538 488 540 490T557 493Q562 493 565 493T570 492T572 491T574 487T577 483L544 351Q511 218 508 216Q505 213 492 213Z"></path></g><g data-mml-node="mo" transform="translate(1550, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1939, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(2511, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg></span><span style="color: rgb(58, 58, 58);font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;font-size: 16px;letter-spacing: 0px;">，</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">解码器</span><span style="color: rgb(58, 58, 58);font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;font-size: 16px;letter-spacing: 0px;cursor: pointer;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2857 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 6.464ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="47" d="M50 252Q50 367 117 473T286 641T490 704Q580 704 633 653Q642 643 648 636T656 626L657 623Q660 623 684 649Q691 655 699 663T715 679T725 690L740 705H746Q760 705 760 698Q760 694 728 561Q692 422 692 421Q690 416 687 415T669 413H653Q647 419 647 422Q647 423 648 429T650 449T651 481Q651 552 619 605T510 659Q492 659 471 656T418 643T357 615T294 567T236 496T189 394T158 260Q156 242 156 221Q156 173 170 136T206 79T256 45T308 28T353 24Q407 24 452 47T514 106Q517 114 529 161T541 214Q541 222 528 224T468 227H431Q425 233 425 235T427 254Q431 267 437 273H454Q494 271 594 271Q634 271 659 271T695 272T707 272Q721 272 721 263Q721 261 719 249Q714 230 709 228Q706 227 694 227Q674 227 653 224Q646 221 643 215T629 164Q620 131 614 108Q589 6 586 3Q584 1 581 1Q571 1 553 21T530 52Q530 53 528 52T522 47Q448 -22 322 -22Q201 -22 126 55T50 252Z"></path></g><g data-mml-node="mi" transform="translate(786, 0)"><path data-c="44" d="M287 628Q287 635 230 637Q207 637 200 638T193 647Q193 655 197 667T204 682Q206 683 403 683Q570 682 590 682T630 676Q702 659 752 597T803 431Q803 275 696 151T444 3L430 1L236 0H125H72Q48 0 41 2T33 11Q33 13 36 25Q40 41 44 43T67 46Q94 46 127 49Q141 52 146 61Q149 65 218 339T287 628ZM703 469Q703 507 692 537T666 584T629 613T590 629T555 636Q553 636 541 636T512 636T479 637H436Q392 637 386 627Q384 623 313 339T242 52Q242 48 253 48T330 47Q335 47 349 47T373 46Q499 46 581 128Q617 164 640 212T683 339T703 469Z"></path></g><g data-mml-node="mo" transform="translate(1614, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(2003, 0)"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="mo" transform="translate(2468, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">和重构编码器</span><span style="color: rgb(58, 58, 58);font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;font-size: 16px;letter-spacing: 0px;cursor: pointer;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 2114 1000" aria-hidden="true" style="vertical-align: -0.566ex;width: 4.783ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="45" d="M492 213Q472 213 472 226Q472 230 477 250T482 285Q482 316 461 323T364 330H312Q311 328 277 192T243 52Q243 48 254 48T334 46Q428 46 458 48T518 61Q567 77 599 117T670 248Q680 270 683 272Q690 274 698 274Q718 274 718 261Q613 7 608 2Q605 0 322 0H133Q31 0 31 11Q31 13 34 25Q38 41 42 43T65 46Q92 46 125 49Q139 52 144 61Q146 66 215 342T285 622Q285 629 281 629Q273 632 228 634H197Q191 640 191 642T193 659Q197 676 203 680H757Q764 676 764 669Q764 664 751 557T737 447Q735 440 717 440H705Q698 445 698 453L701 476Q704 500 704 528Q704 558 697 578T678 609T643 625T596 632T532 634H485Q397 633 392 631Q388 629 386 622Q385 619 355 499T324 377Q347 376 372 376H398Q464 376 489 391T534 472Q538 488 540 490T557 493Q562 493 565 493T570 492T572 491T574 487T577 483L544 351Q511 218 508 216Q505 213 492 213Z"></path></g><g data-mml-node="mo" transform="translate(764, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1153, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(1725, 0)"><g data-mml-node="mo"><path data-c="302" d="M-388 560L-251 694L-243 686Q-113 562 -113 560L-139 531Q-141 532 -197 581L-250 627L-305 580Q-318 569 -331 557T-352 538L-360 532Q-362 530 -375 546L-388 560Z"></path></g></g><g data-mml-node="mo" transform="translate(1725, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g></g></g></svg></span><span style="color: rgb(58, 58, 58);font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;font-size: 16px;letter-spacing: 0px;">，</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">都是适用于正常样本的。当模型在测试阶段接受到一个异常样本，此时模型的编码器，解码器</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;"></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">将不适用于异常样</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">本，此时得到的编码后潜在变量</span><span style="color: rgb(58, 58, 58);font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;font-size: 16px;letter-spacing: 0px;cursor: pointer;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 465 453" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.052ex;height: 1.025ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g></g></g></svg></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">和重构编码器得到的潜在变量</span><span style="color: rgb(58, 58, 58);font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;font-size: 16px;letter-spacing: 0px;cursor: pointer;"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -694 465 705" aria-hidden="true" style="vertical-align: -0.025ex;width: 1.052ex;height: 1.595ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="7A" d="M347 338Q337 338 294 349T231 360Q211 360 197 356T174 346T162 335T155 324L153 320Q150 317 138 317Q117 317 117 325Q117 330 120 339Q133 378 163 406T229 440Q241 442 246 442Q271 442 291 425T329 392T367 375Q389 375 411 408T434 441Q435 442 449 442H462Q468 436 468 434Q468 430 463 420T449 399T432 377T418 358L411 349Q368 298 275 214T160 106L148 94L163 93Q185 93 227 82T290 71Q328 71 360 90T402 140Q406 149 409 151T424 153Q443 153 443 143Q443 138 442 134Q425 72 376 31T278 -11Q252 -11 232 6T193 40T155 57Q111 57 76 -3Q70 -11 59 -11H54H41Q35 -5 35 -2Q35 13 93 84Q132 129 225 214T340 322Q352 338 347 338Z"></path></g><g data-mml-node="TeXAtom" data-mjx-texclass="ORD" transform="translate(465, 0)"><g data-mml-node="mo"><path data-c="302" d="M-388 560L-251 694L-243 686Q-113 562 -113 560L-139 531Q-141 532 -197 581L-250 627L-305 580Q-318 569 -331 557T-352 538L-360 532Q-362 530 -375 546L-388 560Z"></path></g></g></g></g></svg></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">的差距较大。我们规定这个差距是一个分值，设定阈值</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 563.5 950" aria-hidden="true" style="color: rgb(58, 58, 58);font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;font-size: 16px;white-space: normal;vertical-align: -0.452ex;width: 1.275ex;height: 2.149ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="934.6px" font-family="serif">ϕ</text></g></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">为0.2，可根据实际项目进行调整。一旦</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 3997.1 1000" aria-hidden="true" style="white-space: normal;vertical-align: -0.566ex;width: 9.043ex;height: 2.262ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="41" d="M208 74Q208 50 254 46Q272 46 272 35Q272 34 270 22Q267 8 264 4T251 0Q249 0 239 0T205 1T141 2Q70 2 50 0H42Q35 7 35 11Q37 38 48 46H62Q132 49 164 96Q170 102 345 401T523 704Q530 716 547 716H555H572Q578 707 578 706L606 383Q634 60 636 57Q641 46 701 46Q726 46 726 36Q726 34 723 22Q720 7 718 4T704 0Q701 0 690 0T651 1T578 2Q484 2 455 0H443Q437 6 437 9T439 27Q443 40 445 43L449 46H469Q523 49 533 63L521 213H283L249 155Q208 86 208 74ZM516 260Q516 271 504 416T490 562L463 519Q447 492 400 412L310 260L413 259Q516 259 516 260Z"></path></g><g data-mml-node="mo" transform="translate(750, 0)"><path data-c="28" d="M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z"></path></g><g data-mml-node="mi" transform="translate(1139, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g><g data-mml-node="mo" transform="translate(1711, 0)"><path data-c="29" d="M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z"></path></g><g data-mml-node="mo" transform="translate(2377.8, 0)"><path data-c="3E" d="M84 520Q84 528 88 533T96 539L99 540Q106 540 253 471T544 334L687 265Q694 260 694 250T687 235Q685 233 395 96L107 -40H101Q83 -38 83 -20Q83 -19 83 -17Q82 -10 98 -1Q117 9 248 71Q326 108 378 132L626 250L378 368Q90 504 86 509Q84 513 84 520Z"></path></g></g></g></svg><span style="caret-color: rgba(0, 0, 0, 0.8);color: rgba(0, 0, 0, 0.8);font-family: 微软雅黑, HelveticaNeue-Light, &#34;Helvetica Neue Light&#34;, &#34;Helvetica Neue&#34;, Helvetica, Arial, sans-serif;letter-spacing: 1px;text-align: start;text-size-adjust: auto;background-color: rgb(255, 255, 255);"><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -750 563.5 950" aria-hidden="true" style="color: rgb(58, 58, 58);font-family: Optima-Regular, Optima, PingFangSC-light, PingFangTC-light, &#34;PingFang SC&#34;, Cambria, Cochin, Georgia, Times, &#34;Times New Roman&#34;, serif;font-size: 16px;vertical-align: -0.452ex;width: 1.275ex;height: 2.149ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="TeXAtom" data-mjx-texclass="ORD"><g data-mml-node="mo"><text data-variant="normal" transform="matrix(1 0 0 -1 0 0)" font-size="934.6px" font-family="serif">ϕ</text></g></g></g></g></svg></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">模型就认定送入的样本</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -442 572 453" aria-hidden="true" style="white-space: normal;vertical-align: -0.025ex;width: 1.294ex;height: 1.025ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">是异常数据。对于最后结果分数的解析，我们使用了下式的方法，使用一阶范数对比了生成器和重构编码器之间的差异，再以</span><svg xmlns="http://www.w3.org/2000/svg" role="img" focusable="false" viewBox="0 -683 5370.4 765" aria-hidden="true" style="white-space: normal;vertical-align: -0.186ex;width: 12.15ex;height: 1.731ex;"><g stroke="currentColor" fill="currentColor" stroke-width="0" transform="matrix(1 0 0 -1 0 0)"><g data-mml-node="math"><g data-mml-node="mi"><path data-c="4D" d="M289 629Q289 635 232 637Q208 637 201 638T194 648Q194 649 196 659Q197 662 198 666T199 671T201 676T203 679T207 681T212 683T220 683T232 684Q238 684 262 684T307 683Q386 683 398 683T414 678Q415 674 451 396L487 117L510 154Q534 190 574 254T662 394Q837 673 839 675Q840 676 842 678T846 681L852 683H948Q965 683 988 683T1017 684Q1051 684 1051 673Q1051 668 1048 656T1045 643Q1041 637 1008 637Q968 636 957 634T939 623Q936 618 867 340T797 59Q797 55 798 54T805 50T822 48T855 46H886Q892 37 892 35Q892 19 885 5Q880 0 869 0Q864 0 828 1T736 2Q675 2 644 2T609 1Q592 1 592 11Q592 13 594 25Q598 41 602 43T625 46Q652 46 685 49Q699 52 704 61Q706 65 742 207T813 490T848 631L654 322Q458 10 453 5Q451 4 449 3Q444 0 433 0Q418 0 415 7Q413 11 374 317L335 624L267 354Q200 88 200 79Q206 46 272 46H282Q288 41 289 37T286 19Q282 3 278 1Q274 0 267 0Q265 0 255 0T221 1T157 2Q127 2 95 1T58 0Q43 0 39 2T35 11Q35 13 38 25T43 40Q45 46 65 46Q135 46 154 86Q158 92 223 354T289 629Z"></path></g><g data-mml-node="mi" transform="translate(1051, 0)"><path data-c="69" d="M184 600Q184 624 203 642T247 661Q265 661 277 649T290 619Q290 596 270 577T226 557Q211 557 198 567T184 600ZM21 287Q21 295 30 318T54 369T98 420T158 442Q197 442 223 419T250 357Q250 340 236 301T196 196T154 83Q149 61 149 51Q149 26 166 26Q175 26 185 29T208 43T235 78T260 137Q263 149 265 151T282 153Q302 153 302 143Q302 135 293 112T268 61T223 11T161 -11Q129 -11 102 10T74 74Q74 91 79 106T122 220Q160 321 166 341T173 380Q173 404 156 404H154Q124 404 99 371T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mi" transform="translate(1396, 0)"><path data-c="6E" d="M21 287Q22 293 24 303T36 341T56 388T89 425T135 442Q171 442 195 424T225 390T231 369Q231 367 232 367L243 378Q304 442 382 442Q436 442 469 415T503 336T465 179T427 52Q427 26 444 26Q450 26 453 27Q482 32 505 65T540 145Q542 153 560 153Q580 153 580 145Q580 144 576 130Q568 101 554 73T508 17T439 -10Q392 -10 371 17T350 73Q350 92 386 193T423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 180T152 343Q153 348 153 366Q153 405 129 405Q91 405 66 305Q60 285 60 284Q58 278 41 278H27Q21 284 21 287Z"></path></g><g data-mml-node="mo" transform="translate(2218.2, 0)"><path data-c="2212" d="M84 237T84 250T98 270H679Q694 262 694 250T679 230H98Q84 237 84 250Z"></path></g><g data-mml-node="mi" transform="translate(3218.4, 0)"><path data-c="4D" d="M289 629Q289 635 232 637Q208 637 201 638T194 648Q194 649 196 659Q197 662 198 666T199 671T201 676T203 679T207 681T212 683T220 683T232 684Q238 684 262 684T307 683Q386 683 398 683T414 678Q415 674 451 396L487 117L510 154Q534 190 574 254T662 394Q837 673 839 675Q840 676 842 678T846 681L852 683H948Q965 683 988 683T1017 684Q1051 684 1051 673Q1051 668 1048 656T1045 643Q1041 637 1008 637Q968 636 957 634T939 623Q936 618 867 340T797 59Q797 55 798 54T805 50T822 48T855 46H886Q892 37 892 35Q892 19 885 5Q880 0 869 0Q864 0 828 1T736 2Q675 2 644 2T609 1Q592 1 592 11Q592 13 594 25Q598 41 602 43T625 46Q652 46 685 49Q699 52 704 61Q706 65 742 207T813 490T848 631L654 322Q458 10 453 5Q451 4 449 3Q444 0 433 0Q418 0 415 7Q413 11 374 317L335 624L267 354Q200 88 200 79Q206 46 272 46H282Q288 41 289 37T286 19Q282 3 278 1Q274 0 267 0Q265 0 255 0T221 1T157 2Q127 2 95 1T58 0Q43 0 39 2T35 11Q35 13 38 25T43 40Q45 46 65 46Q135 46 154 86Q158 92 223 354T289 629Z"></path></g><g data-mml-node="mi" transform="translate(4269.4, 0)"><path data-c="61" d="M33 157Q33 258 109 349T280 441Q331 441 370 392Q386 422 416 422Q429 422 439 414T449 394Q449 381 412 234T374 68Q374 43 381 35T402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487Q506 153 506 144Q506 138 501 117T481 63T449 13Q436 0 417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157ZM351 328Q351 334 346 350T323 385T277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q217 26 254 59T298 110Q300 114 325 217T351 328Z"></path></g><g data-mml-node="mi" transform="translate(4798.4, 0)"><path data-c="78" d="M52 289Q59 331 106 386T222 442Q257 442 286 424T329 379Q371 442 430 442Q467 442 494 420T522 361Q522 332 508 314T481 292T458 288Q439 288 427 299T415 328Q415 374 465 391Q454 404 425 404Q412 404 406 402Q368 386 350 336Q290 115 290 78Q290 50 306 38T341 26Q378 26 414 59T463 140Q466 150 469 151T485 153H489Q504 153 504 145Q504 144 502 134Q486 77 440 33T333 -11Q263 -11 227 52Q186 -10 133 -10H127Q78 -10 57 16T35 71Q35 103 54 123T99 143Q142 143 142 101Q142 81 130 66T107 46T94 41L91 40Q91 39 97 36T113 29T132 26Q168 26 194 71Q203 87 217 139T245 247T261 313Q266 340 266 352Q266 380 251 392T217 404Q177 404 142 372T93 290Q91 281 88 280T72 278H58Q52 284 52 289Z"></path></g></g></g></svg><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 15px;">进行归一化得到每个样本的异常得分。</span></p></section></section><p style="text-align: center;"><img class="rich_pages wxw-img" data-fileid="100004435" data-galleryid="" data-ratio="0.41324921135646686" data-s="300,640" style="width: 297px;height: 123px;" data-type="png" data-w="634" src="https://wechat2rss.xlab.app/img-proxy/?k=ad16790c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavR8Du15PQrTibdRPqeGLibbIuZPgWfU91fibl4FA8rmrJB6RY00Jd0fB5wAH5HxF545bRtBWn9aVcjVg%2F640%3Fwx_fmt%3Dpng"/></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-size: 14px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;"><strong style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;white-space: normal;font-size: 14px;color: rgb(255, 76, 0);">2.3.3 经验杂谈</strong></span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;">       </span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">GANomaly和VAE这两者都可以用来做行为异常检测，也都是基于训练数据的分布，但是原生的VAE的鲁棒性比原始的GAN更好，而GAN在调优之后效果比VAE更好。同时，对于模型解码得到的结果需要和初始数据进行相似度计算，得到数据的异常得分。</span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">当然基于VAE模型在工业界使用中也面临着一些问题：</span></p><ul class="list-paddingleft-2" style="list-style-type: disc;"><li style="font-size: 15px;"><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">运算资源的消耗。真实应用场景中存在机器的资源限制，由于引入了额外的复杂结构以面临数据中难以挖掘的局部异常无疑会造成训练和推理速度的提升。</span></p></li><li style="font-size: 15px;"><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">运行速度的效率。该类模型通常用于离线的行为检测，针对实时的检测还需要对模型选取和检测方法进一步优化。</span></p></li><li style="font-size: 15px;"><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">阈值的设定。设置异常阈值不符合真实场景中多种指标都需人工指定阈值这一无监督异常检测的通病。因为检测异常是通过对比重构后的结果与原始输入的差距，而这个差距多少就算是异常需要人为定义。</span></p></li></ul><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;"><br/></span></p><section data-mpa-template="t" mpa-from-tpl="t" style="margin-right: 0em;margin-left: 0em;"><section data-mid="" mpa-from-tpl="t" style="display: flex;justify-content: center;align-items: center;width: 578px;"><section data-mid="" mpa-from-tpl="t" style="display: flex;justify-content: center;align-items: center;"><section data-mid="" mpa-from-tpl="t" style="background: rgba(46, 86, 236, 0.3);"><section data-mid="" mpa-from-tpl="t" style="padding-right: 12px;padding-left: 12px;height: 38px;background: rgb(68, 104, 248);transform: translate(5px, -5px);display: flex;justify-content: center;align-items: center;"><section data-mid="" mpa-from-tpl="t" style="padding-right: 6px;padding-left: 6px;text-align: center;"><p data-mid="" style="font-size: 16px;font-family: PingFangSC-Semibold, &#34;PingFang SC&#34;;font-weight: bold;color: rgb(255, 255, 255);line-height: 22px;">三、文末总结<strong style="font-size: 14px;color: rgb(255, 169, 0);font-family: &#34;Helvetica Neue&#34;, Helvetica, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 1px;text-align: left;word-spacing: 2px;background-color: rgb(255, 255, 255);"></strong></p></section></section></section></section></section></section><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><br/></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><span style="font-size: 15px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">       在UEBA的实践中，我们发现结合孤立森林+GANomaly的方法，在基于”数据库审计日志中用户越权访问、主机审计日志中账号的资源访问”等场景都取得了不错的效果。要注意的是，这些方法多用于离线</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 15px;">检测模块。在某些场景中，我们也会采用集成学习、知识蒸馏等方法去降低误报和压缩模型，以提高<span style="font-size: 15px;">模型的<span style="font-size: 15px;">准确性</span>、可解释性和稳定性。</span></span><span style="background-color: rgb(25, 25, 25);color: rgb(255, 0, 0);font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 1px;text-align: left;text-indent: 28px;font-size: 15px;"></span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;text-align: center;"></span></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><br/></p><section mpa-from-tpl="t" style="outline: 0px;white-space: normal;color: rgb(62, 62, 62);"><section mpa-from-tpl="t" style="outline: 0px;"><section mpa-from-tpl="t" style="margin: 2px 10px;outline: 0px;display: flex;justify-content: center;align-items: center;"><section mpa-from-tpl="t" style="outline: 0px;border-width: 1px;border-style: dashed;border-color: rgb(191, 191, 191);width: 657px;"><section mpa-from-tpl="t" style="padding: 15px;outline: 0px;background-image: url(&#34;https://mmbiz.qpic.cn/mmbiz_gif/SotDE9EOhAb3ukB1bLK8LuN8adEjsXwohibDINx5cTsqoVQytL9va5r4z2EeOKB5Am9EoiceMeEt3XQ0LyYibAibFA/640?wx_fmt=gif&#34;);background-position: center center;background-repeat: repeat;"><section mpa-from-tpl="t" style="outline: 0px;align-self: flex-start;"><p style="outline: 0px;letter-spacing: 1.5px;color: rgb(0, 0, 0);line-height: 1.75;"><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 14px;">     </span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#39;Helvetica Neue&#39;, &#39;PingFang SC&#39;, &#39;Hiragino Sans GB&#39;, &#39;Microsoft YaHei UI&#39;, &#39;Microsoft YaHei&#39;, Arial, sans-serif;font-size: 14px;">为帮助企业更好的应对内部威胁，腾讯安全运营中心（SOC）推出了UEBA分析能力，以帮助客户高效、准确、及时的检测风险，从而提升自身安全防护能力，有效降低内部威胁影响。想要了解更多UEBA技术，请</span><span style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;">关注腾讯SOC+UEBA相关介绍。</span></p><p style="outline: 0px;letter-spacing: 1.5px;color: rgb(0, 0, 0);line-height: 1.75;"><br/></p><p style="outline: 0px;letter-spacing: 1.5px;color: rgb(0, 0, 0);line-height: 1.75;"><span style="outline: 0px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 14px;">腾讯SOC-UEBA传送门：</span><a target="_blank" href="http://mp.weixin.qq.com/s?__biz=MzA4NjM1OTYyNA==&amp;mid=2652230054&amp;idx=1&amp;sn=8e22f4510a4a7661c1cc651b0513cfea&amp;chksm=84289a81b35f13976ec447f54fa9903f44be29b9ce911f8ab3d4b3ce7c1e80d08d93abe890a4&amp;scene=21#wechat_redirect" textvalue="腾讯安全中心集成UEBA能力解决内部安全威胁" data-itemshowtype="0" tab="innerlink" data-linktype="2" style="font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;color: rgb(0, 82, 255);"><strong style="font-size: 14px;font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;outline: 0px;">腾讯安全中心集成UEBA能力解决内部安全威胁</strong></a></p><section style="text-align: center;margin-top: 10px;"><img class="rich_pages wxw-img" data-fileid="100004438" data-galleryid="" data-ratio="0.4879807692307692" data-s="300,640" style="" data-type="png" data-w="832" src="https://wechat2rss.xlab.app/img-proxy/?k=b296f081&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavSjHImGzbKtbJvdoopib0syreIyMqRic9X2ickUsicBp7iadyEFm5ahmYhK9D8OFEAHd9kTklUrMZ8pyZw%2F640%3Fwx_fmt%3Dpng"/></section></section></section></section></section></section></section><p style="outline: 0px;"><br/></p><p style="margin-top: 10px;margin-right: 0em;margin-left: 0em;white-space: normal;"><br mpa-from-tpl="t"/></p><section data-mpa-template="t" mpa-from-tpl="t"><section style="display: flex;justify-content: center;align-items: center;width: 100%;justify-content: flex-end;padding: 4px 16px 0px 0px;" data-mid="" mpa-from-tpl="t"><section style="display: flex;justify-content: flex-start;align-items: center;flex-direction: column;" data-mid="" mpa-from-tpl="t"><section style="width: 21px;height: 21px;align-self: flex-start;margin-left: 14px;margin-bottom: -26px;z-index: 1;" data-mid="" mpa-from-tpl="t"><img data-fileid="100004437" data-ratio="1" style="display: block;" data-type="png" data-w="42" src="https://wechat2rss.xlab.app/img-proxy/?k=b81d3a8b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2Ffvdn3AaxR6sldoK7VdUhCXiaQdAvKhF8APVg8MqccDc4t8UicH8bMiaeklzxeqlVicwMWxghHlG0OH6pDHV2ibk5iaQQ%2F640%3Fwx_fmt%3Dpng"/></section><section style="height: 36px;background: #9EC5FF;border-radius: 20px;text-align: center;" data-mid="" mpa-from-tpl="t"><p style="padding: 0px 14px 0px 40px;font-size: 16px;font-family: PingFangSC-Medium, &#34;PingFang SC&#34;;font-weight: bold;color: rgb(255, 255, 255);line-height: 36px;" data-mid="">点个<span style="padding: 0px 4px;" data-mid="">在看</span>你最好看</p></section></section></section></section>



<p><a href="2247488087">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=3ac5a7c4&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247488087%26idx%3D1%26sn%3Dd4c955d251272f700da67ccbce41191f%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 25 Oct 2021 12:00:00 +0800</pubDate>
    </item>
    <item>
      <title>SOC+UEBA：从关联规则到用户实体行为分析的运营思路分享</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484346&amp;idx=1&amp;sn=cad823dda974d08ae2ff767addeb33e7</link>
      <description>结合腾讯SOC在客户侧的运营实践，本文首先介绍安全运营在业界落地中普遍遇到的问题，并分享腾讯SOC在解决该问题时的思路和工作。</description>
      <content:encoded><![CDATA[<p>
原创 <span>御见UEBA团队</span> <span>2021-08-23 17:00</span> <span style="display: inline-block;"></span>
</p>

<p>结合腾讯SOC在客户侧的运营实践，本文首先介绍安全运营在业界落地中普遍遇到的问题，并分享腾讯SOC在解决该问题时的思路和工作。</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=098adf2e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRVZMGHBpiaQdhpN8UB8yDLcBWbMcJ3jU1kOOIPiacOfbUPwaAqZjTibU6kpaU6dL7j6RbqvKZknmGTQ%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 18px;">企业暴露越来越多的业务在公网，这对于攻击者来说，是一个非常庞大的攻击面。攻击者会在这些攻击面上进行非常多的攻击行为，试图找到突破点。从企业角度，企业购买的各类安全产品会不断的上报“遭受攻击”，每天向SOC报告<span style="color: red;">上百万的安全事件</span>，让<span style="color: red;">安全运营人员疲于应对</span>。</span></p><p><br/></p><p style="text-align: center;"><img class="rich_pages wxw-img" data-galleryid="" data-ratio="0.28125" data-s="300,640" style="" data-type="png" data-w="832" src="https://wechat2rss.xlab.app/img-proxy/?k=6a450d38&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRVZMGHBpiaQdhpN8UB8yDLcA0F2WibLZowNuMKL3t9Je2ax2ypeZDda3zxOFwObyLVz5h3NS5xzLvw%2F640%3Fwx_fmt%3Dpng"/></p><p><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 18px;">传统的SOC做法是不断的去调整关联规则，希望能通过关联规则来帮助他们快速从海量告警中找出最严重、最该关注的告警。常用的关联规则手段是通过判断是否有A、B、C等事件按某种模式发生，例如A发生10分钟之内，B发生了，可以生产为一条告警。通过良好的规则运营，<span style="color: red;">关联规则能够将百万级的安全事件压缩至千、百条告警</span>。</span></p><p><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 18px;">关联规则一定程度上能够解决海量告警难以下手运营的问题，但依旧存在着一些痛点问题。例如<span style="color: red;">规则需要随着安全态势的改变而改变、对于出厂规则无法覆盖的安全场景，需要依赖专业的安全运营人员添加、运营的时候，需要人工去组织更多的信息来辅助研判、可能还存在一定程度的误报和漏报等问题。</span></span></p><p><br/></p><p style="text-align: center;"><img class="rich_pages wxw-img" data-galleryid="" data-ratio="0.3557692307692308" data-s="300,640" style="" data-type="png" data-w="832" src="https://wechat2rss.xlab.app/img-proxy/?k=03e6a832&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRVZMGHBpiaQdhpN8UB8yDLcc7xTohv65QEbmlKicJXk5ZF4EcIEmWoXG6wHEEqID5lIbibt5M9UGNLA%2F640%3Fwx_fmt%3Dpng"/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 18px;"><br/></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 18px;">为了解决上述的痛点问题，腾讯SOC提出了用一个能大幅提高运营效率的<span style="font-size: 18px;color: red;">风险时间线和一个智能的风险评分算法</span>来解决这个问题。它的做法是，首先将海量的安全事件和相关的活动日志接入进来，并根据用户和设备两个维度，将安全事件和网络活动串成一个“行为时间线”，并产品化的展示出来；其次利用算法的手段，对用户和设备进行风险评分，其中重点关注在对安全事件进行价值度评估上。一个安全事件在一个用户那是否值得关注，可以考虑“安全事件是不是一直在被上报，且之前都被忽略”、“安全事件是不是只在一个设备上发生了”、“是否发生了跟该安全事件组合时非常敏感的事件序列”等。</span></p><p><br/></p><p style="text-align: center;"><img class="rich_pages wxw-img" data-galleryid="" data-ratio="0.5072115384615384" data-s="300,640" style="" data-type="png" data-w="832" src="https://wechat2rss.xlab.app/img-proxy/?k=1cb04fa6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRVZMGHBpiaQdhpN8UB8yDLcX6IicjG8QpapzU9iaFX3nmibYibsAYepJQzXiau2oeedrSCK1ba436xiccFg%2F640%3Fwx_fmt%3Dpng"/></p><p><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 18px;">通过智能的风险评分，<span style="font-size: 18px;color: red;">腾讯SOC将运营海量告警的问题转化为优先级明确的用户/设备的风险处置问题</span>。通过一个用户/设备列表，可以一目了然的看到有风险的设备有哪些，哪些是已经失陷的，哪些是面临高风险的，以及哪些是安全的。在对用户/设备的运营阶段，通过一个包含安全事件和网络活动的风险时间线，运营人员可以快速的感知到这个用户/设备上发生了哪些安全事件、哪些网络活动，这些事件发生的先后顺序是怎么样的，从而可以快速判断是否需要响应。</span></p><p><br/></p><p style="text-align: center;"><img class="rich_pages wxw-img" data-galleryid="" data-ratio="0.5024038461538461" data-s="300,640" style="" data-type="png" data-w="832" src="https://wechat2rss.xlab.app/img-proxy/?k=6d7437a0&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRVZMGHBpiaQdhpN8UB8yDLcDn91KUu6qMJRFaMWgfeLKDtkXTZPxErk6rRTCj4ibjbXgEzUDUJq6ag%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><hr style="border-style: solid;border-width: 1px 0 0;border-color: rgba(0,0,0,0.1);-webkit-transform-origin: 0 0;-webkit-transform: scale(1, 0.5);transform-origin: 0 0;transform: scale(1, 0.5);"/><p style="text-align: center;"><strong style="text-align: center;white-space: normal;max-width: 100%;font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 16px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">智能化 自动化 一站式</strong></p><p style="white-space: normal;text-align: center;"><img data-ratio="1" data-w="258" data-type="jpeg" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/></p><p style="white-space: normal;text-align: center;"><span style="font-size: 18px;color: rgb(53, 53, 53);font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 1px;text-align: start;background-color: rgb(255, 255, 255);">（长按二维码快速扫描关注）</span></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="text-align: center;max-width: 100%;font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 16px;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family:mp-quote, -apple-system-font, system-ui, Helvetica Neue, PingFang SC, Hiragino Sans GB, Microsoft YaHei UI, Microsoft YaHei, Arial, sans-serif;"><span style="font-size: 17px;letter-spacing: normal;"><span style="color: rgb(53, 53, 53);font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 18px;letter-spacing: 1px;text-align: left;text-indent: 34px;background-color: rgb(255, 255, 255);">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习</span><span style="color: rgb(53, 53, 53);font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 18px;letter-spacing: 1px;text-align: left;text-indent: 34px;background-color: rgb(255, 255, 255);">、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。</span><span style="color: rgb(53, 53, 53);font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 18px;letter-spacing: 1px;text-align: left;text-indent: 34px;background-color: rgb(255, 255, 255);">通</span><span style="color: rgb(53, 53, 53);font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 18px;letter-spacing: 1px;text-align: left;text-indent: 34px;background-color: rgb(255, 255, 255);">过分享、交流，推动安全智能的落地、应用。</span><span style="color: rgb(53, 53, 53);font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 18px;letter-spacing: 1px;text-align: left;text-indent: 34px;background-color: rgb(255, 255, 255);">欢迎关注~</span></span></span></span><br/></p>



<p><a href="2247484346">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=34964449&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484346%26idx%3D1%26sn%3Dcad823dda974d08ae2ff767addeb33e7%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 23 Aug 2021 17:00:00 +0800</pubDate>
    </item>
    <item>
      <title>腾讯SOC + 一个行为分析引擎</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484337&amp;idx=1&amp;sn=3d2e40cb681115897b2a82c7767b9bef</link>
      <description>soc的独特优势在于它有一个最强大脑，它利用多只眼睛汇聚过来的信息，借助自己的平台能力来进行更高级的威胁分析，从而使得它信息更全面、更准确、更能全链路追随威胁及风险。</description>
      <content:encoded><![CDATA[<p>
原创 <span>御见UEBA团队</span> <span>2021-08-09 17:00</span> <span style="display: inline-block;"></span>
</p>

<p>soc的独特优势在于它有一个最强大脑，它利用多只眼睛汇聚过来的信息，借助自己的平台能力来进行更高级的威胁分析，从而使得它信息更全面、更准确、更能全链路追随威胁及风险。</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=109df5a7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRqiabHice3M8UqK8AUgSUQNYwGWN4QSibFQu4cJxItBbN995nibru6XkeqS2GODqKKQteV0upglk289g%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;">T-Sec 安全运营中心（专有云）(以下简称腾讯SOC）核心是想提供给企业安全人员一个统一的安全运营和管理平台，让安全人员无论在面对<span style="color: rgb(255, 0, 0);">外部攻击者攻击</span>、或者<span style="color: rgb(255, 0, 0);">内部账号/设备失陷</span>时，都能<span style="color: rgb(255, 0, 0);">高效、及时、精准</span>的感知到，从而能够及时响应安全事件。</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"> </span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;">这意味着SOC上首先且基础要做的是接入 企业安全相关的数据。国内企业在“纵深防御”的思路指导下，大都配有防火墙，waf，抗D，终端，NTA，DLP等多种安全设备。<span style="color: rgb(0, 0, 0);font-family: DengXian;text-indent: 28px;">腾讯SOC</span>内置400+个解析模版，覆盖多个知名厂家，多种类型的安全设备，这使得他能够以最快的速度、最低的成本，几乎无修改的帮客户完成大部分的数据接入和解析工作。</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"> </span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;">在数据接入工作完成以后，SOC相当于多了许多“眼睛”，这些“眼睛”在各自的“岗位”上去记录数据，提供给SOC让它进行深度加工。相比其他品类的安全产品，SOC</span><span style="font-size: 16px;"><span style="font-size: 16px;color: rgb(255, 0, 0);">的独特优势在于它有一个最强大脑，它利用多只眼睛汇聚过来的信息，借助自己的平台能力来进行更高级的威胁分析，从而使得它信息更全面、更准确、更能全链路追随威胁及风险</span></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;"> </span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;">在<span style="color: rgb(0, 0, 0);font-family: DengXian;text-indent: 28px;">腾讯SOC</span>中，<span style="color: rgb(255, 0, 0);">UE风险分析引擎，从用户和设备两个维度去做深度的威胁分析。</span></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;"> </span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;">它首先将“眼睛”看到的数据进行信息上的完善，<span style="color: rgb(255, 0, 0);">将某些缺失的信息通过上下文和其他的平台数据智能化的补充上</span>，重点是用户和设备相关的信息。例如某些设备上出现“访问恶意域名”的告警，最初并不知道是哪个用户操作的，在<span style="color: rgb(0, 0, 0);font-family: DengXian;text-indent: 28px;">腾讯SOC</span>的最强大脑中，它可以通过更丰富的数据“联想”到具体某个用户在哪个设备进行了风险操作。</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;"> </span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;">之后，它将每个用户和每个设备的风险时间线梳理出来，<span style="color: rgb(255, 0, 0);">时间线上包括敏感的告警事件、风险事件、和网络活动</span>。例如“张三在上午9点从邮件下载了一份文件”，“上午9:05，他被告警：pc上存在恶意的通信活动”。分析引擎<span style="color: rgb(255, 0, 0);">基于UE风险时间线进行最深层次的威胁分析</span>。<span style="color: rgb(255, 0, 0);">它从算法和专家经验两方面进行分析</span>：（1）行为模式有没有改变，例如登录模式的改变、资源访问范围的扩大、内网渗透行为的出现；（2）有没有安全专家关注的行为序列，例如[“设备被漏洞利用”、“主机上出现后门”、“出现异常的的外连”、“权限的提升行为”]等。</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;"> </span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;">相比其他的安全告警，<span style="color: rgb(0, 0, 0);font-family: DengXian;text-indent: 28px;">腾讯SOC</span>想<span style="color: rgb(255, 0, 0);">通过“UE行为分析引擎”输出的是更有安全意义的case。</span><strong><span style="color: rgb(255, 0, 0);"></span></strong>这里区别在于“是否有安全意义”。例如主机上可以报“异常时间登录”，但却无法确认是否是恶意的，是否是需要有后续步骤去跟进的。在UE行为分析引擎中，它通过上下文分析的能力，可以确认行为是否是恶意的。例如“异常时间登录”，它历史以来都一直在这个异常的时间点登录，那就忽略风险。如果不是，那就会增加设备的风险度。并且，如果登录行为有其他维度的异常点，或者它上下文存在一些敏感的异常行为，例如异常登录之后，连接内网中陌生的服务器等，那它的风险值会急速攀升，从而能将风险及时告知到客户。</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;"> </span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><span style="font-size: 16px;">通过UE风险引擎，将风险定位到之后，为了提升客户的安全运营及响应效率，<span style="color: rgb(0, 0, 0);font-family: DengXian;text-indent: 28px;">腾讯SOC</span>将用户和设备的风险时间线绘到产品中，<span style="color: rgb(255, 0, 0);">它希望客户从</span><span style="color: rgb(255, 0, 0);font-family: DengXian;text-indent: 28px;">腾讯SOC</span><span style="color: rgb(255, 0, 0);">推送的告警中，回到产品中时，仅需要几分钟时间去确认风险，就能完成安全运营</span>，而不是数个小时，多个页面，多个维度的搜集信息。我们想，这是比较理想的安全运营流程。</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-indent: 28px;"><br/></p><p style="text-align: center;"><img class="rich_pages wxw-img" data-galleryid="" data-ratio="0.5288461538461539" data-s="300,640" style="" data-type="png" data-w="832" src="https://wechat2rss.xlab.app/img-proxy/?k=29791b23&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRqiabHice3M8UqK8AUgSUQNYV0cicBYGk9y9RGsBTGn2VQmf6l5KAfwuWqV4lRicB7LIQ3zb25xnBMIg%2F640%3Fwx_fmt%3Dpng"/></p><p><br/></p><p><span style="font-size: 18px;">ps. 如有疑问，欢迎发送消息到【腾讯安全智能】</span><img data-ratio="1" style="display:inline-block;width:20px;vertical-align:text-bottom;" data-type="png" data-w="20" src="https://wechat2rss.xlab.app/img-proxy/?k=9b13807e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRqiabHice3M8UqK8AUgSUQNYIV8T5ib0iaeklR6AfIbvW9HczgHEaNozlmbpESJxpjF41khs8SPXKQCQ%2F640%3Fwx_fmt%3Dpng"/><br/></p><hr style="border-style: solid;border-width: 1px 0 0;border-color: rgba(0,0,0,0.1);-webkit-transform-origin: 0 0;-webkit-transform: scale(1, 0.5);transform-origin: 0 0;transform: scale(1, 0.5);"/><p style="text-align: center;"><br/></p><p style="text-align: center;"><span style="font-size: 18px;"><strong style="max-width: 100%;font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 16px;letter-spacing: 0.544px;text-align: center;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">智能化 自动化 一站式</strong></span></p><p style="text-align: center;"><br/></p><p style="text-align: center;"><img data-ratio="1" data-w="258" data-type="jpeg" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/></p><p style="text-align: center;"><span style="font-size: 18px;color: rgb(53, 53, 53);font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 1px;text-align: start;background-color: rgb(255, 255, 255);">（长按二维码快速扫描关注）<br/></span></p><section style="margin-right: 16px;margin-left: 16px;max-width: 100%;font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></section><p style="margin-right: 16px;margin-left: 16px;max-width: 100%;min-height: 1em;font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);text-align: left;text-indent: 2em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(53, 53, 53);font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 1px;font-size: 18px;box-sizing: border-box !important;overflow-wrap: break-word !important;">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。欢迎关注~</span></p><p style="margin-right: 16px;margin-left: 16px;max-width: 100%;min-height: 1em;font-family: -apple-system, system-ui, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);text-align: left;text-indent: 2em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="text-align: center;"><br/></p>



<p><a href="2247484337">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=afbf2c75&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484337%26idx%3D1%26sn%3D3d2e40cb681115897b2a82c7767b9bef%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 09 Aug 2021 17:00:00 +0800</pubDate>
    </item>
    <item>
      <title>腾讯安全-SOAR</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484330&amp;idx=1&amp;sn=934c2e23db8764d1a78d63c43bb774ae</link>
      <description>数据显示，到2022年，30%的5人以上的安全团队将会采用SOAR（安全编排与自动化响应）。你是那30%吗？</description>
      <content:encoded><![CDATA[<p>
原创 <span></span> <span>2021-04-20 13:12</span> <span style="display: inline-block;"></span>
</p>

<p>数据显示，到2022年，30%的5人以上的安全团队将会采用SOAR（安全编排与自动化响应）。你是那30%吗？</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=639e61a9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSfibptHuFfxolG1NPiaibqq79Z3SAXYweSLX4o2aM8EIr5gGM5t08ficsKaBnt4OyHqZdEicLy68oTd3A%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<div class="share_notice" id="js_common_share_desc_wrap"><div class="weui-ellipsis__text__wrp"><span id="js_common_share_desc" class="weui-ellipsis__text"></span></div>
         
        </div>
        




<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=756cdb5f&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484330%26idx%3D1%26sn%3D934c2e23db8764d1a78d63c43bb774ae%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Tue, 20 Apr 2021 13:12:00 +0800</pubDate>
    </item>
    <item>
      <title>UEBA实体画像技术设计和应用</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484322&amp;idx=1&amp;sn=f6acb48d423f6f6c4f42de0ee1d20933</link>
      <description>在基础安全领域中，通过实体画像技术可以从多维度对检测对象进行描绘。这些描绘的成果将成为复杂安全检测，与复杂网络攻击调研的数据基础。</description>
      <content:encoded><![CDATA[<p>
原创 <span>御见UEBA团队</span> <span>2021-04-19 11:07</span> <span style="display: inline-block;"></span>
</p>

<p>在基础安全领域中，通过实体画像技术可以从多维度对检测对象进行描绘。这些描绘的成果将成为复杂安全检测，与复杂网络攻击调研的数据基础。</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=89bbbb23&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSUXbibKFhDd8H5R7ovfV1weiatribKKPYiaFfROh6YemEQ6MfAf09WR6ZWgZM0dhWUQw4xgOo9GcZDHg%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<h3 style="white-space: normal;text-indent: 2em;text-align: center;"><br/></h3><h3 style="white-space: normal;text-indent: 2em;text-align: center;"><strong><span style="font-size: 20px;">一、什么是实体画像</span></strong></h3><p><br/></p><section style="white-space: normal;text-indent: 2em;">实体画像是通过标签对主体（用户、设备、ip等主体均可）特点进行刻画的数据技术。标签具体生成方式通常是针对实体的静态信息，动态行为进行数据统计，数据挖掘。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">当前实体画像已广泛的应用于广告，营销活动等互联网产品商业化数据应用中。此外实体画像在基础安全领域也发挥了重要的作用，例如UEBA，威胁情报产品都用到了实体画像技术。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">在基础安全领域中，通过实体画像技术可以从多维度对检测对象进行描绘。这些描绘的成果将成为复杂安全检测，与复杂网络攻击调研的数据基础。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;"><br/></section><h3 style="white-space: normal;text-indent: 2em;text-align: center;"><strong><span style="font-size: 20px;">二、实体画像和基线技术的区别</span></strong></h3><p style="white-space: normal;"><br/></p><section style="white-space: normal;text-indent: 2em;">基线技术特点是针对对象短期的，单维度的行为进行检测。其检测的形式有静态基线检测与动态基线检测，例如网络安全上服务器不设定密码，或者异地登陆等。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">基线技术无法解决长时间、多维度，以及多实体的复杂检测场景。而实体画像技术则可以弥补这一缺陷。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">实体画像技术，会基于主体的历史数据，动态的更新每个主体的标签。可以进行单主体多标签检测，以及多主体多标签检测。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">我们将这两种技术特点的比较总结如下：</section><section style="white-space: normal;text-indent: 2em;">                           </section><p style="white-space: normal;text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.47307692307692306" data-s="300,640" data-w="520" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=240899e5&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavSUXbibKFhDd8H5R7ovfV1weZSA4CaYd7oEkMdx6m21kMEoeTgkNbicyt5Gn68xfRRHZCeeJTBpu5oQ%2F640%3Fwx_fmt%3Dpng"/></p><section style="white-space: normal;text-indent: 2em;"> </section><section style="white-space: normal;text-indent: 2em;"><br/></section><h3 style="white-space: normal;text-indent: 2em;text-align: center;"><strong><span style="font-size: 20px;">三、实体画像实现技术介绍</span></strong></h3><p style="white-space: normal;"><br/></p><section style="white-space: normal;text-indent: 2em;">实现实体画像的流程一般分三个阶段：画像设计、画像生产、画像应用。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><p style="white-space: normal;text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.45901639344262296" data-s="300,640" data-w="732" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=c9f4e90f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavSUXbibKFhDd8H5R7ovfV1wey7bVsHJSYDMc50flsp8w0BUTYmevf5qiaQztg7nnZhibyj5ghevs4GUw%2F640%3Fwx_fmt%3Dpng"/></p><section style="white-space: normal;text-indent: 2em;"> </section><section style="white-space: normal;text-indent: 2em;">画像设计包含画像结构设计，标签生成逻辑设计，技术选型设计。通常此步骤完成时，即可输出一个明确的画像生产需求清单。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">画像生产的技术框架一般如下：统一采集层负责画像需要用到的数据，数据存储层负责将采集后的日志分级存储，并进行清洗，画像生成需要提供全量、增量、结构变更功能。</section><section style="white-space: normal;text-indent: 2em;"> </section><p style="white-space: normal;text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.4371754932502596" data-s="300,640" data-w="963" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=607418eb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavSUXbibKFhDd8H5R7ovfV1weP3qwdAsib9GDy0KtrnHnZgLZcK1bItp3IdJpZvMpKiaGCal9yicibzp5mQ%2F640%3Fwx_fmt%3Dpng"/></p><section style="white-space: normal;text-indent: 2em;"> </section><section style="white-space: normal;text-indent: 2em;">画像应用方向一般有基于画像的指标统计（从顶层观测态势），群组划分（归并同类用户），异常检测（发现离群的用户）。</section><section style="white-space: normal;text-indent: 2em;"> </section><section style="white-space: normal;text-indent: 2em;"><br/></section><h3 style="white-space: normal;text-indent: 2em;text-align: center;"><strong><span style="font-size: 20px;">四、实体画像在UEBA中的应用</span></strong></h3><p style="white-space: normal;"><br/></p><section style="white-space: normal;text-indent: 2em;">文章上面已经提到，实现实体画像的流程一般分三个阶段：画像设计、画像生产，画像应用。这里详细介绍后面两个部分，画像生产和画像应用在UEBA中的实现和应用。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">针对画像生产部分，我们开发了一套可以对画像多个层次进行可插拔配置的系统，实现画像配置多个层次的可插拔，灵活生成任意画像中任意行为下任意的画像特征。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">针对画像应用部分，我们采用基于ai引擎的检测框架，对原始数据和对应的画像数据进行定时调度和场景检测，复用ai引擎强大的机器学习和人工智能检测能力，以及大数据分布式快速计算能力，实现多种丰富的智能化的检测场景。</section><section style="white-space: normal;text-indent: 2em;"> </section><section style="text-indent: 0em;white-space: normal;text-align: left;"><span style="font-size: 18px;"><strong><span style="text-indent: 2em;">1、画像配置多个层次可插拔</span></strong></span></section><section style="text-indent: 0em;white-space: normal;text-align: left;"><br/></section><section style="white-space: normal;text-indent: 2em;">UEBA当前的画像系统可以实现多方面的自定义配置，即无需修改任何代码，仅修改配置表就可完成画像类型的增减、画像描述行为的增减、画像特征字段的增减等配置，从三个层次实现画像的灵活配置，满足多种业务需求。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">画像类型是指该画像是描述什么主体的，例如用户画像、设备画像等。画像描述行为是指某种主体的画像中可描述的行为有哪些，这些描述行为主要是通过目前已有的日志中的数据行为总结归纳出来的，例如登录行为、权限变更行为、访问内部系统行为、上传数据行为、下载数据行为等。画像特征字段是指某种主体的画像中的某种描述行为下有哪些特征字段，这是画像目前最细粒度的描述，例如常用时间、常用源设备、常用源城市、常访问资源、历史源设备、历史源地址等字段。</section><section style="white-space: normal;text-indent: 2em;"> </section><p style="white-space: normal;text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.43333333333333335" data-s="300,640" data-w="1170" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=5c9e01fe&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavSUXbibKFhDd8H5R7ovfV1weQjE36SKqzK8E9kSx8xKbgDsc9lTRmgwTQxAtt9pq5UCEmkWDkFnqkA%2F640%3Fwx_fmt%3Dpng"/></p><section style="white-space: normal;text-indent: 2em;"> </section><section style="white-space: normal;text-indent: 2em;">通过以上三种层次的画像配置，可以配置出任意类型画像中任意行为下任意的画像特征。例如画像类型配置了用户画像，用户画像下配置了登录行为，用户画像的登录行为下配置了常用时间、常用源设备、常用源城市、历史源设备、历史源地址等特征字段，那么就能生成用户画像下基于登录行为的一系列特征，这些特征描述可以用来进行后续的画像行为检测，可以用于产品展示。</section><section style="white-space: normal;text-indent: 2em;"> </section><section style="text-indent: 0em;white-space: normal;"><strong><span style="font-size: 18px;">2、采用ai引擎框架进行智能化分布式检测</span></strong></section><section style="text-indent: 0em;white-space: normal;"><br/></section><section style="white-space: normal;text-indent: 2em;">腾讯UEBA复用了腾讯基础SOC自研的ai引擎智能检测框架，基于画像生成系统生成的画像数据进行画像多功能场景的检测。Ai引擎框架是采用大数据分布式技术开发的一套拥有强大机器学习和人工智能检测能力的机器学习算法检测平台，将定时调度、灵活参数配置、任意算法选择、分布式快速计算等多个功能集成为一体，为智能化检测提供了基础。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">画像生成系统生成的画像数据和原始待检测数据共同作为ai引擎框架中画像检测部分的输入，通过在ai引擎画布流上配置特征处理模块、算法检测模块、策略处理模块等，实现特征、算法、策略的灵活搭配，其中每一个模块内部又是可多参数灵活配置的。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.49921875" data-s="300,640" style="width: 557px;height: 278px;" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=1905556a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavSUXbibKFhDd8H5R7ovfV1wetVX9najPwE01sP15W1PjicmgopMpI7VXibzcy3icD21e1mfufyeLaR6sw%2F640%3Fwx_fmt%3Dpng"/></p><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">为了实现画像场景的检测，我们不仅可以复用原ai引擎中已有的机器学习检测算法，还开发了多个更加适用于画像场景的检测算法。目前基于ai引擎对画像进行检测的算法包括但不限于基于画像的指标统计（从顶层观测态势），群组划分（归并同类实体），异常检测（发现离群的实体）等方法。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">其中画像的基础检测方法包括但不限于如下场景：非常用行为检测、首次行为检测等。</section><section style="white-space: normal;text-indent: 2em;"> </section><p style="white-space: normal;text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.32274247491638797" data-s="300,640" data-w="598" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=977fb897&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavSUXbibKFhDd8H5R7ovfV1werYb5ib4yS92qbW5jTicyKf0sPR31T7XFcX8MdMdSMobXCpzry3Oj30Xg%2F640%3Fwx_fmt%3Dpng"/></p><section style="white-space: normal;text-indent: 2em;"> </section><section style="white-space: normal;text-indent: 2em;">异常检测方法是基于原数据和对应画像数据拼接后的数据，针对数据的多维度特征中是否存在异常特征以及是否整体为异常数据进行检测的方法。Ai引擎检测框架上已实现了多种异常检测算法，例如iForest、oneclass_svm、maha_svd、LOF等。通过ai引擎画布流的配置，可以轻松实现多种特征的生成和组合、算法多个参数的配置和检测等。通过分析异常的检测结果，可以明确该条数据异常的原因以及异常的程度，帮助后续安全运营和告警做辅助判断。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">群组划分是基于群组进行群组特征的总结分析，然后基于群组的特征检测当前数据的异常行为。这里对群组采用聚类、分类等机器学习算法进行划分，同时配合系统内部不同层次的标签划分生成不同的群组。对于不同群组的主体（用户、设备等），采用以上提到的画像基础检测方法、异常维度检测方法等对源数据进行检测。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">群组划分本身采用的聚类和分类算法可以通过ai引擎框架进行配置检测，且可以快速复用并配置ai引擎检测框架上已实现的多种聚类、分类算法，对算法的检测效果也能实现一定程度上的可视化展示。基于群组划分后的结果再进行画像基础检测、异常维度检测等场景，同样可以在ai引擎框架上进行灵活快速地配置和检测。</section><section style="white-space: normal;text-indent: 2em;"> </section><h3 style="text-indent: 0em;white-space: normal;"><strong><span style="font-size: 18px;">5、腾讯实体画像技术的独特优势</span></strong></h3><p><br/></p><section style="white-space: normal;text-indent: 2em;">腾讯云中实体画像通过了腾讯云内部实际场景验证。已在服务云上的海量用户。Ueba实体画像是腾讯云画像应用的缩影，继承了腾讯云实体画像的设计思路，检测方案。在可行性，稳定性，准确性上会优于其他同类功能。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;">同时由于画像设计的一脉相承，ueba实体画像可以与云画像效果相互印证，解决私有化下难以判别检测结果是否误报的困难。</section><section style="white-space: normal;text-indent: 2em;"><br/></section><p style="white-space: normal;text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.7103109656301145" data-s="300,640" style="width: 380px;height: 270px;" data-type="png" data-w="611" src="https://wechat2rss.xlab.app/img-proxy/?k=1d56bfba&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavSUXbibKFhDd8H5R7ovfV1weexKUncDIich94n3kZblOWO9OIG3MWibyKJF0icKsuibj8E2HuXoSDW5GZA%2F640%3Fwx_fmt%3Dpng"/></p><section style="white-space: normal;text-indent: 2em;"><br/></section><section style="white-space: normal;text-indent: 2em;"><br/></section><hr style="white-space: normal;border-style: solid;border-right-width: 0px;border-bottom-width: 0px;border-left-width: 0px;border-color: rgba(0, 0, 0, 0.1);transform-origin: 0px 0px;transform: scale(1, 0.5);"/><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><br/></section><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><span style="font-size: 16px;"><strong>智能化 自动化 一站式</strong></span></section><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><br/></section><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><img data-ratio="1" data-w="258" data-type="jpeg" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/><br/></section><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><span style="font-size: 16px;color: rgb(53, 53, 53);font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;text-align: start;background-color: rgb(255, 255, 255);letter-spacing: 1px;">（长按二维码快速扫描关注）</span></section><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><span style="font-size: 16px;color: rgb(53, 53, 53);font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;text-align: start;background-color: rgb(255, 255, 255);letter-spacing: 1px;"><br/></span></section><p style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: left;text-indent: 2em;"><span style="color: rgb(53, 53, 53);font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 1px;font-size: 16px;">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。欢迎关注~</span></p><p><br/></p>



<p><a href="2247484322">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=a260180b&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484322%26idx%3D1%26sn%3Df6acb48d423f6f6c4f42de0ee1d20933%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 19 Apr 2021 11:07:00 +0800</pubDate>
    </item>
    <item>
      <title>基于深度学习的webshell检测</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484290&amp;idx=1&amp;sn=a891f3db44e391aed62a7fe4fbf61cbd</link>
      <description>1.背景介绍Webshell是一种基于web应用的后门程序，是黑客在入侵过程中经常使用的一类恶意工具之一。w</description>
      <content:encoded><![CDATA[<p>
原创 <span>韩孟玲</span> <span>2021-03-23 14:30</span> <span style="display: inline-block;"></span>
</p>

<p>1.背景介绍Webshell是一种基于web应用的后门程序，是黑客在入侵过程中经常使用的一类恶意工具之一。w</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=19ccf56c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOCCCCpNGpPUqUOZiaIyVIibbCwmFibFU5cuicoeWrQYQia75iafQDQShcg7Sag%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p style="text-align:center;"><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;"><br/></span></strong></span></p><p><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;">1.背景介绍</span></strong></span></p><p><span style="text-indent: 28px;font-family: 微软雅黑, sans-serif;font-size: 17px;"><br/></span></p><p><span style="font-size: 17px;text-indent: 28px;font-family: 微软雅黑, sans-serif;">Webshell是一种基于web应用的后门程序，是黑客在入侵过程中经常使用的一类恶意工具之一。web渗透中黑客可以利用特定的Webshell获取服务器权限，进而进行服务器文件操作、数据库操作以及盗取用户私密信息等。</span></p><p style="text-indent:28px;"><br/></p><p style="text-indent:28px;"><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;"><br/></span></p><p><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;">业务背景：</span></strong><span style="font-family: 微软雅黑, sans-serif;">将基于AI的webshell检测引擎作为重保/护网项目的样本检出插件使用。</span></span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;"><br/></span></p><p><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;">业务目标：</span></strong><span style="font-family: 微软雅黑, sans-serif;">建立webshell检测模型，对输入样本进行解析和识别，并输出该样本的标签。</span></span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;"><br/></span></p><p><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;">2.数据理解及处理</span></strong></span></p><p><br/></p><p><span style="font-size: 17px;text-indent: 21px;font-family: 微软雅黑, sans-serif;">Webshell脚本文件的类型有php、jsp、asp、aspx等，其中php样本占webshell样本的70%左右。</span></p><p><br/></p><p><span style="font-size: 17px;text-indent: 21px;font-family: 微软雅黑, sans-serif;">php的简单webshell：</span></p><p><span style="text-indent: 21px;font-family: 微软雅黑, sans-serif;font-size: 17px;"><br/></span></p><p style="text-indent:21px;"><br/></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.10025706940874037" data-s="300,640" style="" data-type="png" data-w="389" src="https://wechat2rss.xlab.app/img-proxy/?k=d9ac4355&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOCVZL6J8p4Suiad2ibb9pyAlXAFAb8AO28iac5Mia9ocqNCDwTHycdV72vOw%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="font-size: 17px;text-indent: 28px;text-align: justify;font-family: 微软雅黑, sans-serif;">jsp的简单webshell：</span></p><p style="text-align: left;"><br/></p><p style="text-indent:28px;"><br/></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.11057692307692307" data-s="300,640" style="" data-type="png" data-w="416" src="https://wechat2rss.xlab.app/img-proxy/?k=e86008d3&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOCSPDHamib4KIPPe5BSbyMwvXIXNay3HGOyvacafF8qZWvSp2BVicJoa2Q%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-size: 17px;font-family: 微软雅黑, sans-serif;">  </span></p><p style="text-align: left;"><span style="font-size: 17px;font-family: 微软雅黑, sans-serif;">      asp的简单webshell:</span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;">                 </span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.13427561837455831" data-s="300,640" style="" data-type="png" data-w="283" src="https://wechat2rss.xlab.app/img-proxy/?k=63373314&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOCdIyokIMWF1XpDAJezTlunlj0ElqmBYhIeI9nnaQqGqTchc2gYGAQqQ%2F640%3Fwx_fmt%3Dpng"/><span style="font-family: 微软雅黑, sans-serif;text-align: justify;font-size: 17px;">  </span></p><p><br/></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;">从PHP源代码层面分析复杂，不适合做一些语言处理的工作，因此无法作为深度学习模型的输入。PHP脚本代码在经过编译后，生成可以直接运行的中间代码OPCODE，也称字节码，具有时序性。</span></p><p style="text-indent:98px;"><br/></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;"> </span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="1.3890675241157557" data-s="300,640" style="" data-type="png" data-w="311" src="https://wechat2rss.xlab.app/img-proxy/?k=d54a5984&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOCe1YeibD3PlzIiciadRd0EIXRh0m0AJq6SZIhdqKHv2xARZVIvwc7BAemg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.7316561844863732" data-s="300,640" style="" data-type="png" data-w="477" src="https://wechat2rss.xlab.app/img-proxy/?k=b01c65d6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOCHeoVdicLIEQXnf0ccyiaVx4iaTDFSA0yr6yfKnsHsOsrE4700wiaGfUH1Q%2F640%3Fwx_fmt%3Dpng"/></p><p><br/></p><p><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;">3.特征处理</span></strong></span></p><p><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;"><br/></span></strong></span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;">获取opcode序列及其参数信息，去掉无用信息</span></p><p><span style="font-size: 17px;font-family: 微软雅黑, sans-serif;"> </span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.7211740041928721" data-s="300,640" style="" data-type="png" data-w="477" src="https://wechat2rss.xlab.app/img-proxy/?k=4d221e50&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOCia3prgVUldOQF5a2xr3KXibyp2NkWrJz0OKR2DwCQw7HZpFgw7QicKl8Q%2F640%3Fwx_fmt%3Dpng"/><span style="text-align: justify;font-family: 微软雅黑, sans-serif;font-size: 17px;"> </span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;"> </span></p><p><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;">4.算法方案</span></strong></span></p><p><br/></p><p><strong><span style="font-size: 17px;font-family: 微软雅黑, sans-serif;text-indent: 14px;">初始方案：</span></strong><span style="font-size: 17px;font-family: 微软雅黑, sans-serif;text-indent: 14px;">TextCNN模型是使用卷积神经网络来处理NLP问题的经典模型</span></p><p><span style="font-family: 微软雅黑, sans-serif;text-indent: 14px;font-size: 17px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.7516483516483516" data-s="300,640" style="" data-type="png" data-w="455" src="https://wechat2rss.xlab.app/img-proxy/?k=b4128172&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOC5lapxMjtwcgFN0FCt5W21qj5xYFgsuD0qYLgYMZSO8XQLGgKwOIa1w%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-indent:14px;"><br/></p><p><strong><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;">改进方案：</span></strong><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;">加入时序信息，在原来的基础上引入n-gram，构造双输入模型。</span></p><p><br/></p><p><span style="font-size: 17px;font-family: 微软雅黑, sans-serif;">n-gram模型基于这样一种假设，第n个词的出现只与前面n-1个词相关，而与其它任何词都不相关，整句的概率就是各个词出现概率的乘积。当 n=2, 一个二元模型（2-gram model)即为 ：</span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;"><br/></span></p><p><br/></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.19463087248322147" data-s="300,640" style="" data-type="png" data-w="298" src="https://wechat2rss.xlab.app/img-proxy/?k=3102ebf3&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOCPk4qG8l4nRqxWJpZq4uCicnicSmLb0YKD6cibyEv0egqpTNxSYCYK7R8g%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p><br/></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;">基于n-gram的双输入TextCNN模型：</span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.7696850393700787" data-s="300,640" style="" data-type="png" data-w="508" src="https://wechat2rss.xlab.app/img-proxy/?k=c7e702e4&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOCDjBxGkHXjcwpVEfXrWiaK0XW0HuvjK3wtGC32ibsDHYibicjuI0oU8wqjw%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-size: 17px;"><br/></span></p><p><br/></p><p><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;">真实场景</span></strong><span style="font-family: 微软雅黑, sans-serif;">：webshell正常页面中的比例可能不足万分之一，正负样本比例差异非常大，导致训练的模型存在一定的偏差。可使用<span style="color: rgb(34, 34, 34);background: white;">Stacking</span>的方式。</span></span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;"><br/></span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;">（1）正常样本比例作为初始训练集，训练基分类器。</span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;">（2）根据基分类器结果再训练第二个分类器；</span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;"><br/></span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;">采用上述方式可以消除真实场景样本比例差距大的问题。</span></p><p><span style="font-family: 微软雅黑, sans-serif;font-size: 17px;"><br/></span></p><p><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;">5.效果展示</span></strong></span></p><p><span style="font-size: 17px;"><strong><span style="font-family: 微软雅黑, sans-serif;"><br/></span></strong></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.2857142857142857" data-s="300,640" style="" data-type="png" data-w="616" src="https://wechat2rss.xlab.app/img-proxy/?k=3363d1f9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTBcAibH282uicrLONjZVscOCQrZbHKa69dR27FibUa9cYwMvb1Ix2ORCcW04SNDFWzXJ6qom9PEo2iaA%2F640%3Fwx_fmt%3Dpng"/></p><section style="margin-right: 16px;margin-left: 16px;max-width: 100%;font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></section><section style="margin-right: 16px;margin-left: 16px;max-width: 100%;font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><img data-type="jpeg" data-ratio="1" data-w="258" style="box-sizing: border-box !important;overflow-wrap: break-word !important;width: 258px !important;visibility: visible !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/><br style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"/></section><section style="margin-right: 16px;margin-left: 16px;max-width: 100%;font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(53, 53, 53);text-align: start;letter-spacing: 1px;font-size: 17px;box-sizing: border-box !important;overflow-wrap: break-word !important;">（长按二维码快速扫描关注）<br style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"/></span></section><section style="margin-right: 16px;margin-left: 16px;max-width: 100%;font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);text-align: left;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(53, 53, 53);letter-spacing: 1px;font-size: 15px;box-sizing: border-box !important;overflow-wrap: break-word !important;">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。欢迎关注~</span></section><p><br/></p>



<p><a href="2247484290">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=973e7b03&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484290%26idx%3D1%26sn%3Da891f3db44e391aed62a7fe4fbf61cbd%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Tue, 23 Mar 2021 14:30:00 +0800</pubDate>
    </item>
    <item>
      <title>UEBA场景之数据库安全</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484275&amp;idx=1&amp;sn=7b315766d4ed1be28f04623f6a684a41</link>
      <description>一、UEBA场景是什么 腾讯御见UEBA（用户实体行为分析）使用一系列分析方法（统计学习、机器学习等）通过</description>
      <content:encoded><![CDATA[<p>
原创 <span>御见UEBA团队</span> <span>2021-02-26 11:30</span> <span style="display: inline-block;"></span>
</p>

<p>一、UEBA场景是什么 腾讯御见UEBA（用户实体行为分析）使用一系列分析方法（统计学习、机器学习等）通过</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=db43346c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRk3ibwmWqRv8mYYpeicsRu9EdwTYuBZRJQBvrtiapzfcyTDU0X7rvn3xmKrabYroIbL3ib77rZKaRQag%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p><br/></p><p style="text-align:center;line-height:150%;"><strong><span style="font-size:19px;line-height:150%;"> 一、UEBA</span></strong><strong><span style="font-size:19px;line-height:150%;">场景是什么</span></strong></p><p style="text-align:center;line-height:150%;"><strong><span style="font-size:19px;line-height:150%;"><br/></span></strong></p><p style="text-indent:28px;line-height:150%;"> 腾讯御见UEBA（用户实体行为分析）使用一系列分析方法（统计学习、机器学习等）通过分析用户实体相关行为日志，对用户及其实体进行风险监测分析和风险评估，最终识别内部风险用户和风险实体。通过持续跟踪用户和实体的行为，可以全面地了解内部威胁风险，将原始日志、活动、告警、事件与用户和实体关联，构建完整的用于分析、调查的事件上下文。</p><p style="text-indent:28px;line-height:150%;"> </p><p style="text-indent:28px;line-height:150%;">参考Gartner建议和业界典型方案， UEBA进行分析的数据源需要包括系统/应用日志、用户活动审计日志以及安全设备检测到的风险事件三大类。以腾讯UEBA为例，当前支持分析的数据源包括Linux系统日志、Windows安全事件日志日志、堡垒机审计日志、VPN审计日志、零信任网关审计日志、数据库审计日志，以及天眼云镜HIDS、御界NTA等的安全检测事件。腾讯UEBA的具体场景是按照以上数据源类型进行划分的，每个场景大类下又细分为多个具体检测场景，而我们的UEBA风险事件检测就是基于细分的具体场景进行检测的。</p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-indent:28px;line-height:150%;">本文主要介绍的是数据库安全场景的探索和实现。</p><p style="text-indent:0;line-height:150%;"> </p><p style="text-indent:0;line-height:150%;"><br/></p><p style="text-align:center;line-height:150%;"><strong><span style="font-size:19px;line-height:150%;">二、数据库安全场景探索</span></strong></p><p style="text-align:center;line-height:150%;"><strong><span style="font-size:19px;line-height:150%;"><br/></span></strong></p><p style="line-height:150%;"><strong><span style="font-size:16px;line-height:150%;">1、</span></strong><strong><span style="font-size:16px;line-height:150%;">数据库审计日志获取</span></strong></p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-indent:28px;line-height:150%;">我们常用的免费数据库一般是MySQL，或者是MySQL数据库的衍生版MariaDB。MariaDB虽然被视为MySQL数据库的替代品，但它在扩展功能、存储引擎以及一些新的功能改进方面都强过MySQL，且是完全开源的。MariaDB跟MySQL在绝大多数方面是兼容的，对于开发者来说，几乎感觉不到任何不同。由于我们目前的实际研发环境就是基于MariaDB的，因此我们选择MariaDB作为数据库安全场景探索的开始。</p><p style="text-indent:28px;line-height:150%;"> </p><p style="text-indent:28px;line-height:150%;">MariaDB_5.5.37版本和MariaDB_10.0.10以后版本的自带适配的audit插件，能够方便地收集数据库的操作。首先查看数据库审计插件存放的目录：</p><p style="text-align: left;text-indent: 28px;line-height: 150%;">show variables like &#39;%plugin%&#39;</p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-indent:28px;line-height:150%;">如果server_audit.so安装程序不在plugin_dir的目录下，需要先将server_audit.so下载到plugin_dir的目录下。找到配置文件my.cnf所在的位置，并向my.cnf文件中增加如下配置：</p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-align: left;text-indent: 28px;line-height: 150%;">plugin-load=server_audit=server_audit.so</p><p style="text-align: left;text-indent: 28px;line-height: 150%;">server_audit_logging = ON（打开审计日志开关）</p><p style="text-align: left;text-indent: 28px;line-height: 150%;">server_audit_file_path = **（审计日志存放路径，该路径下会生成一个server_audit.log文件记录相关操作记录）</p><p style="text-align: left;text-indent: 28px;line-height: 150%;">server_audit_events = &#39;CONNECT,QUERY,TABLE&#39;</p><p style="text-align: left;text-indent: 28px;line-height: 150%;">server_audit_incl_users = test（指定哪些用户的活动将记录，connect将不受此变量影响）</p><p style="text-align:center;text-indent:28px;line-height:150%;"><br/></p><p style="text-indent:28px;line-height:150%;">然后重启数据库：</p><p style="text-align: left;text-indent: 28px;line-height: 150%;">service mysqld restart</p><p style="text-align: left;text-indent: 28px;line-height: 150%;"><br/></p><p style="text-indent:28px;line-height:150%;">查看audit插件的参数情况可以运行命令：</p><p style="text-align: left;text-indent: 28px;line-height: 150%;">show variables like &#39;%audit%&#39;</p><p style="text-indent:0;line-height:150%;"> </p><p style="line-height:150%;"><strong><span style="font-size:16px;line-height:150%;">2、</span></strong><strong><span style="font-size:16px;line-height:150%;">数据库审计日志分析</span></strong></p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-indent:28px;line-height:150%;">配置好数据库审计日志后，就可以在server_audit_file_path下的server_audit.log文件中查看指定用户的活动记录，记录截图如下。</p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.23370786516853934" data-s="300,640" style="width: 460px;height: 108px;" data-type="png" data-w="445" src="https://wechat2rss.xlab.app/img-proxy/?k=ebb1399f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRk3ibwmWqRv8mYYpeicsRu9ETK8AiavoFzG8NxBkF86LxxYibgVenuWPMwAZLp2F5rwuonXt5zjjMVicw%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.14938488576449913" data-s="300,640" style="" data-type="png" data-w="569" src="https://wechat2rss.xlab.app/img-proxy/?k=c86c3965&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRk3ibwmWqRv8mYYpeicsRu9Exsp7xA3mhqGR77NtJlaPQVsu7ZPyIiczq6nkJskCzy2HHZYnAjoLh8A%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-indent:28px;line-height:150%;">  </p><p style="text-indent:28px;line-height:150%;">一条审计日志的组成结构如下为[timestamp][serverhost][username][host][connection] [queryid][type][database][object][retcode]。</p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-indent:28px;line-height:150%;">其中serverhost代表数据库所在的服务主机名，username代表该条记录的操作用户，host代表该操作执行所在的服务器，一般为localhost、127.0.0.1或实际ip地址如192.168.190.111。connection代表该记录所属的连接段id，该字段一般在登录数据库时更新。queryid代表本次操作的id。type取值最常见的有CONNECT,DISCONNECT,QUERY几种。如上图所示，CONNECT代表连接数据库，DISCONNECT代表断开数据库的连接，QUERY代表命令行的查询操作。database代表当前操作的数据库。object代表命令行的具体内容。retcode代表当前操作执行是否成功，如果执行成功则为0，否则为错误代码。</p><p style="line-height:150%;"> </p><p style="line-height:150%;"><strong><span style="font-size:16px;line-height:150%;">3、</span></strong><strong><span style="font-size:16px;line-height:150%;">包含数据库操作的其他类型日志</span></strong></p><p style="line-height:150%;"><strong><span style="font-size:16px;line-height:150%;"><br/></span></strong></p><p style="text-indent:0;line-height:150%;">     数据库审计日志中的信息能帮助我们识别很多异常行为，但是仍有一些数据库操作无法被记录在数据库审计日志中。例如mysql登录命令mysql -h 127.0.0.1 -u root -p -P 3306，数据库数据导出命令mysqldump -u username -p dbname &gt; dbname.sql等。在这种情况下我们其实是需要记录linux系统的cmd命令，然后对这些命令进行分析检测。</p><p style="line-height:150%;"> </p><p style="line-height:150%;">     在我们已支持接入的数据源中，堡垒机日志、HIDS日志中一般是包含cmd命令相关的日志的。因此，在UEBA已经接入业务环境中的堡垒机日志或主机HIDS日志的情况下，如果想审计mysql、mysqldump相关的数据库安全命令，可以直接基于堡垒机或HIDS中的命令日志。</p><p style="line-height:150%;"> </p><p style="line-height:150%;"><br/></p><p style="text-align:center;line-height:150%;"><strong><span style="font-size:19px;line-height:150%;">三、数据库安全场景设计和实现</span></strong></p><p><br/></p><p style="line-height:150%;"><strong style="white-space: normal;"><span style="font-size: 16px;line-height: 24px;">1、</span></strong><strong style="white-space: normal;"><span style="font-size: 16px;line-height: 24px;">场景主体划分</span></strong></p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-indent:28px;line-height:150%;">腾讯御见UEBA的分析场景既包括围绕员工/用户行为的行为分析、风险识别，也包括针对特定设备、主机进行的失陷检测、异常行为识别。两者对应的场景设计和实现根据数据源的不同有所不同。</p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-indent:28px;line-height:150%;">对于从数据库审计日志中获取数据所设计的场景的主体有两种情况，一种是主体既能对应到设备又能对应到用户，另一种是主体只能对应到设备而无法对应到用户。这是因为通过数据库审计日志中的host获取到的ip代表当前登录数据库的设备ip，该ip可以结合设备的其他标识信息映射为设备id，因此数据库审计日志场景的主体是肯定能对应到设备的。但是由于登录数据库的设备很大可能是堡垒机、跳板机这类公共服务器，该公共服务器并不一定能够挂靠到具体某个用户，因此仅根据数据库审计日志数据设计的场景是存在无法挂靠到用户的情况的。<br/></p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-indent:28px;line-height:150%;">对于从腾讯云堡垒机日志中获取数据所设计的场景，由于堡垒机一般来说都是基于账号登录的，而UEBA中账号一般是可以关联到对应的用户上。这里的用户一般是指运维人员及对应的运维账户。因此根据堡垒机日志设计的场景主体通过用户账号的映射一般可以直接关联到特定的人员。<br/></p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.621875" data-s="300,640" style="" data-type="jpeg" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=bdd0019e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRk3ibwmWqRv8mYYpeicsRu9EQwypdZRR7log657MpX978WibLrZdiaGpQRBSCpElwO71NaJb7MFVxT7w%2F640%3Fwx_fmt%3Djpeg"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;">    上图是UEBA以用户为主体的场景列表，以设备为主体的场景列表和以用户为主体的场景列表基本遵循同一套逻辑。<br/></p><p style="line-height:150%;"> </p><p style="line-height:150%;"><strong><span style="font-size:16px;line-height:150%;">2、</span></strong><strong><span style="font-size:16px;line-height:150%;">场景设计示例</span></strong></p><p style="line-height:150%;">     <br/></p><section style="line-height: 150%;text-indent: 2em;"><span style="line-height:150%;">腾讯UEBA在行为分析、风险识别上，一方面通过构建行为基线识别异常行为，另一方面则会识别和监控风险操作、高危活动。下面是数据库相关的典型场景示例。</span></section><p style="text-indent:0;line-height:150%;"><br/></p><p style="white-space: normal;line-height: 25.5px;">（1）<span style="font-variant-numeric: normal;font-variant-east-asian: normal;font-stretch: normal;font-size: 9px;line-height: normal;">    </span>提权操作成功</p><p style="white-space: normal;line-height: 25.5px;"><span style="text-indent: 28px;">日志类型：</span><span style="text-indent: 28px;">数据库审计日志或堡垒机日志</span></p><p style="white-space: normal;line-height: 25.5px;">检测方法：审计日志sql语句或堡垒机日志的命令行包含drop database **，且操作成功</p><p style="text-indent:0;line-height:150%;"><br/></p><p style="line-height:150%;">（2）<span style="font-variant-numeric: normal;font-variant-east-asian: normal;font-stretch: normal;font-size: 9px;line-height: normal;">    </span>删除数据库成功</p><p style="line-height:150%;"><span style="text-indent: 28px;">日志类型：</span><span style="text-indent: 28px;">数据库审计日志或堡垒机日志</span></p><p style="text-indent:0;line-height:150%;">检测方法：审计日志sql语句或堡垒机日志的命令行包含drop database **，且操作成功</p><p style="text-indent:0;line-height:150%;"> </p><p style="line-height:150%;">（3）<span style="font-variant-numeric: normal;font-variant-east-asian: normal;font-stretch: normal;font-size: 9px;line-height: normal;">    </span>短时间频繁清除数据</p><p style="line-height:150%;"><span style="text-indent: 28px;">日</span><span style="text-indent: 28px;">志类型：</span><span style="text-indent: 28px;">数据库审计日志或堡垒机日志</span></p><p style="text-indent:0;line-height:150%;">检测方法：短时间审计日志sql语句或堡垒机日志命令行是否频繁以truncate table开头，或delete from开头</p><p style="text-indent:0;line-height:150%;"> </p><p style="line-height:150%;">（4）<span style="font-variant-numeric: normal;font-variant-east-asian: normal;font-stretch: normal;font-size: 9px;line-height: normal;">    </span>短时间频繁删除表</p><p style="line-height:150%;"><span style="text-indent: 28px;">日志类型：</span><span style="text-indent: 28px;">堡垒机日志</span></p><p style="text-indent:0;line-height:150%;">检测方法：短时间审计日志sql语句或堡垒机日志命令行是否频繁以drop table开头</p><p style="text-indent:0;line-height:150%;"> </p><p style="line-height:150%;">（5）<span style="font-variant-numeric: normal;font-variant-east-asian: normal;font-stretch: normal;font-size: 9px;line-height: normal;">    </span>无密码登录</p><p style="line-height:150%;"><span style="text-indent: 28px;">日志类型：</span><span style="text-indent: 28px;">堡垒机日志</span></p><p style="text-indent:0;line-height:150%;">检测方法：命令行以mysql开头无-p参数</p><p style="text-indent:0;line-height:150%;"> </p><p style="line-height:150%;">（6）<span style="font-variant-numeric: normal;font-variant-east-asian: normal;font-stretch: normal;font-size: 9px;line-height: normal;">    </span>明文密码登录</p><p style="line-height:150%;"><span style="text-indent: 28px;">日志类型：</span><span style="text-indent: 28px;">堡垒机日志</span></p><p style="text-indent:0;line-height:150%;">检测方法：命令行以mysql开头带-p参数且有对应值</p><p style="text-indent:0;line-height:150%;"> </p><p style="line-height:150%;">（7）<span style="font-variant-numeric: normal;font-variant-east-asian: normal;font-stretch: normal;font-size: 9px;line-height: normal;">    </span>导出mysql数据（数据库备份）</p><p style="line-height:150%;"><span style="text-indent: 28px;">日志类型：</span><span style="text-indent: 28px;">堡垒机日志</span></p><p style="text-indent:0;line-height:150%;">检测方法：命令行包含mysqldump</p><section style="margin-left: 24px;line-height: 150%;text-indent: 2em;">    </section><section style="white-space: normal;line-height: 25.5px;text-indent: 2em;"><span style="text-indent: 2em;">以上是</span><span style="text-indent: 2em;">几个</span><span style="text-indent: 2em;">数据库安全场景的示例，由于堡垒机日志中的命令行既可以记录登录数据库时的命令如mysql、mysqldump等，又可以记录登录数据库后的sql语句，因此通过堡垒机日志能够比数据库审计日志设计的场景涵盖范围更广。</span></section><p style="line-height:150%;"> </p><p style="line-height:150%;"><strong><span style="font-size:16px;line-height:150%;">3、</span></strong><strong><span style="font-size:16px;line-height:150%;">场景实现说明</span></strong></p><p style="line-height:150%;"><strong><span style="font-size:16px;line-height:150%;"><br/></span></strong></p><section style="line-height: 150%;text-indent: 2em;">以上每一个细分场景对应一条检测规则，检测的设计逻辑分为两种，一种是直接对单条原始数据做检测，另一种是对多条原始数据的聚合结果做检测。直接对单条原始日志做检测需要配置的参数包括查询条件、检测时间粒度、该条规则的检测结果类型和对应描述等。其中检测时间粒度的含义是每隔多久对存量日志进行一次该条规则的检测。对多条原始数据的聚合结果做检测需要配置的参数除了以上的参数外，还包括聚合检测的条件、聚合主键等。</section><p style="line-height:150%;"> </p><section style="line-height: 150%;text-indent: 2em;">例如要检测的场景为“短时间频繁删除表”，该检测规则是聚合类检测规则，需要额外定义聚合检测的条件，即“频繁”代表的具体次数。当检测时间粒度定义为10分钟，聚合检测的条件定义为聚合总条数大于10，聚合主键定位为ip时，即表示当某ip满足查询条件的原始数据条数在十分钟之内数量大于10时触发该规则，引发事件告警。</section><p style="text-align: center;"><span style="text-align: justify;"> </span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.621875" data-s="300,640" style="" data-type="jpeg" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=f564ed0f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRk3ibwmWqRv8mYYpeicsRu9E2kygRvYvw5Aky0LlQDqpY8ZSCWMovicv50qSEovuE4zcGXQBxNyI8rw%2F640%3Fwx_fmt%3Djpeg"/></p><p style="text-align: center;"><span style="text-align: justify;"> </span></p><p style="line-height:150%;"><strong><span style="font-size:16px;line-height:150%;">4、</span></strong><strong><span style="font-size:16px;line-height:150%;">小结</span></strong></p><p style="line-height:150%;"><strong><span style="font-size:16px;line-height:150%;"><br/></span></strong></p><p style="text-indent:28px;line-height:150%;"> 本文以数据库安全相关场景为例，介绍了腾讯UEBA的安全场景设计和实现。虽然，文中介绍的数据库场景是基于规则的方式实现的，更具体的来说就是直接基于单条或多条原始日志进行筛选、聚合以实现关键风险行为识别。</p><p style="text-indent:28px;line-height:150%;"><br/></p><p style="text-indent:28px;line-height:150%;">但是，在产品中的在其他一些场景中，腾讯UEBA还实现了基于画像的检测、基于机器学习的检测等复杂检测分析方法。基于历史基线、同类群组、序列检测算法、异常检测算法、聚类算法等方法，发现更多异常风险，构建更加丰富可靠的用户实体分析全景。<br/></p><p style="line-height: 150%;"> </p><p style="line-height: 150%;"><br/></p><hr style="white-space: normal;border-style: solid;border-right-width: 0px;border-bottom-width: 0px;border-left-width: 0px;border-color: rgba(0, 0, 0, 0.1);transform-origin: 0px 0px;transform: scale(1, 0.5);"/><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><br/></section><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><span style="font-size: 16px;"><strong>智能化 自动化 一站式</strong></span></section><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><br/></section><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><img data-w="258" data-type="jpeg" data-ratio="1" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/><br/></section><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: center;"><span style="font-size: 16px;color: rgb(53, 53, 53);font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;text-align: start;background-color: rgb(255, 255, 255);letter-spacing: 1px;">（长按二维码快速扫描关注）<br/></span></section><section style="margin-right: 16px;margin-left: 16px;white-space: normal;text-align: left;"><span style="color: rgb(53, 53, 53);font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;background-color: rgb(255, 255, 255);letter-spacing: 1px;font-size: 16px;">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。欢迎关注~</span></section><p style="line-height: 150%;"><br/></p>



<p><a href="2247484275">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=2ee28754&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484275%26idx%3D1%26sn%3D7b315766d4ed1be28f04623f6a684a41%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Fri, 26 Feb 2021 11:30:00 +0800</pubDate>
    </item>
    <item>
      <title>fbprophet方法在ueba中的应用</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484259&amp;idx=1&amp;sn=17a397fd81cee37fade72afc74ae03f9</link>
      <description>腾讯御见UEBA（用户实体行为分析）面向政务、金融、能源等行业的办公安全、数据安全、员工行为管理，使用一系列</description>
      <content:encoded><![CDATA[<p>
原创 <span>御见UEBA团队</span> <span>2021-02-09 14:53</span> <span style="display: inline-block;"></span>
</p>

<p>腾讯御见UEBA（用户实体行为分析）面向政务、金融、能源等行业的办公安全、数据安全、员工行为管理，使用一系列</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=511b4f8e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4GEHqrzwfY62CeVnEia81EJiaJQxGqC6tGuROEfJGvibuNgY3RukOq9GGg%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;">腾讯御见UEBA（用户实体行为分析）</span><span style="letter-spacing: 1px;text-indent: 28px;">面向政务、金融、能源等行业的办公安全、数据安全、员工行为管理，使用一系列</span><span style="letter-spacing: 1px;text-indent: 28px;">分析方法（统计学习、机器学习等高级分析方法）通过分析用户实体（用户、设备、主机等）相关行为日志构建用户实体画像（静态画像、动态画像），然后基于用户实体画像进行风险检测、风险分析、风险评估，最终识别内部风险用户和风险实体。</span><span style="letter-spacing: 1px;text-indent: 28px;">在产品上，提供仪表板和风险时间线能力，帮助感知和运营，提升运营效率。</span></p><h1 style="max-width: 100%;font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;text-indent: 28px;box-sizing: border-box !important;overflow-wrap: break-word !important;"></span></span></h1><p style="text-align: center;"><img class="rich_pages" data-ratio="0.5004995004995005" data-s="300,640" style="" data-type="png" data-w="1001" src="https://wechat2rss.xlab.app/img-proxy/?k=711e28fd&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd46EyfTZpgLic9d3lT5QhOjCicy4rNx5xQXFNOsIntSphIhQo9XsCDm8qQ%2F640%3Fwx_fmt%3Dpng"/></p><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-align: justify;text-indent: 28px;">在用户实体行为分析(UEBA)中，很多场景都会用到时间序列分析、预测、检测相关的技术，例如：</span><br/></section><ul class="list-paddingleft-2" style="list-style-type: square;margin-left: 16px;margin-right: 16px;"><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;">检测某个重要服务器外发的数据大小是否异常</span></p></li><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;">检测两个端点之间的通信模式是否异常</span></p></li><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;">检测某个账号从服务器下载的数据量是否异常</span></p></li><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;">检测某个用户访问的内网资源数量是否异常</span></p></li><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;">检测用户每天的首次活跃时间是否有异常</span></p></li></ul><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;">然而，</span><span style="letter-spacing: 1px;text-indent: 28px;color: rgb(255, 0, 0);">传统的分析方法无法较好的应对多周期、多变点、趋势变化等复杂因素下的时间序列检测问题，在落地中会带来较多的误报。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;color: rgb(255, 0, 0);"></span><span style="letter-spacing: 1px;text-indent: 28px;">因此，我们在UEBA的落地实践中，针对时间序列检测和预测问题做了一系列算法上的调研与落地尝试。本文主要介绍在复杂时间序列异常检测问题上，广泛受认可的方法：</span><span style="letter-spacing: 1px;text-indent: 28px;color: rgb(255, 0, 0);">fbprophet。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;color: rgb(255, 0, 0);"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;color: rgb(0, 0, 0);">本文内容分为几个部分：</span></section><ol class="list-paddingleft-2" style="list-style-type: decimal;margin-left: 16px;margin-right: 16px;"><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">介绍有关时间序列的基本知识。先让大家理解算法</span><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">上如何看待时间序</span><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">列这类数</span><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">据。</span><br/></p></li><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">介绍</span><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">fbprophet方法的原理。</span><br/></p></li><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">介绍该方法与LSTM方法的效果对比，及分享我们在UEBA中做场景落地时候的收获。</span><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;"></span></p></li><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">小结。</span></p></li><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">附录：</span><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">自动选择拐点时的处理逻辑</span><br/></p></li><li><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;">小彩蛋</span></p><p style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="color: rgb(0, 0, 0);letter-spacing: 1px;text-indent: 28px;"></span></p></li></ol><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><strong><span style="font-size: 21px;">引言</span></strong></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;text-align: justify;">时间序列在机器学习领域，是比较特别的一类数据。原因是它在取值之外，加上了时间维度。在检测问题上，它检测的是</span><span style="text-indent: 28px;text-align: justify;color: rgb(255, 0, 0);">在某个时间点，观察到这个取值是否是正常的</span></span><span style="text-indent: 28px;text-align: justify;letter-spacing: 1px;color: rgb(255, 0, 0);">，</span><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;">而不是仅仅看取值是不是正常。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;">例如，某个服务器在凌晨发1G/分钟的数据出去，与在中午12点发1G/分钟的数据的意义是不一样的，正常情况下，我们更倾向于中午12点的观测是由于访问量增加导致的，而凌晨的观测可能是由于被攻击导致的。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;">因此，在检测时间序列之前，我们首先需要对时间序列的常见模式有个基本的认识。目前，</span><span style="text-indent: 28px;text-align: justify;letter-spacing: 1px;color: rgb(255, 0, 0);">工业界和学术界普遍将时间序列建模为如下几种因素，周期、频率、趋势、节假日、随机波动</span><span style="letter-spacing: 1px;color: rgb(255, 0, 0);">。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;color: rgb(255, 0, 0);"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;color: rgb(255, 0, 0);"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: justify;">下面结合一组图来介绍时间序列的几个关键概念，让大家对它有一个直观的理解，例如下图1和图2具有明显的周期形状(某个形状重复出现)，下图1和下图2的周期重复频率又是不一样的(<span style="letter-spacing: 1px;text-indent: 28px;">某个形状重复出现</span>的快慢不一样)，图1的频率比图2的频率高。图3和图4则在周期之外，添加了趋势分量，图3为平稳上升的趋势，图4则是平稳下降趋势。图5和图6则有了“均值漂移”的表现，在两张图中的中间部分可以看到“陡增“和“陡降”形状，在这部分改变之后，时间序列的走势又趋于平稳，在UEBA中我们叫它“拐点”，业界结合业务因素将这种“拐点”解释为由于节假日或者故障导致的波动因素。</span></section><section style="white-space: normal;text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.8632218844984803" data-s="300,640" data-w="329" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=92889b4d&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4iavh7aYCd8EnKtDHaccfCefvC5zArs6ccc1c319sR1ic8OfILepBWXWQ%2F640%3Fwx_fmt%3Dpng"/></section><section style="white-space: normal;text-align: center;text-indent: 28px;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">图1 时间序列类型示意图</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="color: red;">我们面对的时间序列检测问题，可以理解为是在复杂的因素综合作用下，识别哪些是异常变化，而不是由于趋势变化、周期变化、节假日活动影响导致的预期内变化。</span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;text-align: justify;"><br/></span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="color: red;"></span><strong style="text-indent: 28px;text-align: justify;"></strong><span style="text-indent: 28px;text-align: justify;">该问题在行业内是一个极具挑战的问题，而在我们的产品中，由于要把异常检测的能力做成一个通用的内置能力提供给客户，还要保证良好的效果，因此，在算法选型上具有更大的挑战。</span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;text-align: justify;"><br/></span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;text-align: justify;">结合我们团队在时间序列检测上的一些积累，下文分享工业界领先的fbprophet方法及在ueba中的应用尝试。</span></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;text-indent: 28px;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><strong><span style="font-size: 21px;">1. fbprophet方法</span></strong></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;text-align: left;">fbprophet方法是facebook开源的一个时间序列检测利器，频繁被AIOps作为瑞士军刀使用。它的特点在于</span><span style="text-indent: 28px;text-align: left;color: rgb(255, 0, 0);">调参成本低，即便不调参，也可以获得不错的效果，它的另一个优点是训练成本低，在UEBA的大部分场景中，它可以在分钟级别完成训练和预测，并且效果媲美训练了2，3个小时的lstm模型</span>。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;text-align: left;"><br/></span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><strong style="text-indent: 28px;text-align: left;"></strong><span style="text-indent: 28px;text-align: left;">这个优点，让它我们私有化的场景中加分不少，因为我们UEBA上，计算资源紧张，并且检测的问题很多。那么它是如何做到在保证质量的同时，还能在分钟级完成建模的呢？</span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;text-align: left;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="text-align: left;text-indent: 28px;letter-spacing: 1px;">Fbprophet方法基于传统的加性模型，它将时间序列建模为趋势、周期、节假日和高斯噪声分量的加和，也就是说将观测的结果看作是4个分量的加法作用，可以表示为：</span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.04751131221719457" data-s="300,640" style="" data-type="png" data-w="884" src="https://wechat2rss.xlab.app/img-proxy/?k=cc69a363&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd40hgavnPOsjm4kwfUWtbsZGdBuToX4oGcEtibrg5wDXI5H7D9y5a2eQA%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-align: left;text-indent: 28px;">其中g(t), s(t),h(t)分别为趋势分量、周期分量、节假日分量，</span><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4fQ6J6N0Tic6CKNtr0TT5rUicpm4XtwSwgf1nXzelgdh3uKQkxfPiaibmaQ/0?wx_fmt=png" data-cropx1="0" data-cropx2="19" data-cropy1="0" data-cropy2="16" data-ratio="0.8888888888888888" data-s="300,640" style="text-align: center;width: 19px;height: 16px;" data-type="jpeg" data-w="18" src="https://wechat2rss.xlab.app/img-proxy/?k=b016bfd6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4BB8EtNxBqn3bSyPukCYFibgTWRVA8ooNVtbHGZKMiaOHX9adklu6wPcA%2F640%3Fwx_fmt%3Djpeg"/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-align: left;text-indent: 28px;">为高斯噪声分量。在这个框架下，该方法为每个子分量精心的设计了模型。</span><br/></section><section style="margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"> </span></section><section style="margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><br/></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;font-size: 18px;"><strong> 1.1 关于趋势分量g(t)</strong></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;">fbprophet提到使用两种模型分别是</span><span style="text-indent: 28px;color: rgb(255, 0, 0);">饱和增长模型和线性模型来建模趋势分量</span><span style="text-indent: 28px;">。其中饱和增长模型的含义是指观测指标有个理论上的上限，且观测指标的变化以某个速率进行变化。</span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;"><br/></span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;">例如，环境的可容纳人口有上限60亿，人口每年以0.4%的速率进行增长，那么我们观测每年的地球人口数量，可以按基础的饱和增长模型进行预测。饱和增长模型的基本形式如下：</span></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.07323688969258589" data-s="300,640" style="" data-type="png" data-w="1106" src="https://wechat2rss.xlab.app/img-proxy/?k=623ff63a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4iaaHicbddsVe1zAYI98YnKpk53gh1x5sv4Dagfba70GVlomUwIGh71PA%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">g(t)为趋势分量随时间变化的函数。其中C为饱和总量，k为增长率，m为常量偏置项。比较特别的是，在fbprophet这个方法中，它提出C，k都不应该是一个常量，它们应该也会随着时间t而变化。怎么理解呢？</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">例如在互联网中，我们监控产品DAU，C则为网民数量，而网民数量不是静态不变的，它也是不断增加的，而同样的，在DAU上的增长率k也应是动态变化的。在这个设想下，C建模为时间t的函数C（t），在考虑k的变化的时候，则会更精细一点，它会考虑哪些因素对k有重要的影响，例如“拐点”。假设时间序列中存在S个拐点，每个拐点都对时间序列的走势有影响，那么在j时刻的影响大小为j之前时刻的拐点影响的总和。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">基于这个思路，首先将这些拐点的改变用向量表示为</span><img class="rich_pages" data-ratio="0.047619047619047616" data-s="300,640" style="text-align: center;width: 536px;height: 26px;" data-type="png" data-w="546" src="https://wechat2rss.xlab.app/img-proxy/?k=e9a06c3f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4ak8K66z2vjL6ex53vl5PBtyY3FggmqD9ZjSd5XUvChHiaFnV0qp1t7w%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">其中</span><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd47DTV4vpoBUkpZncRY8uS37u8FueEOicMRLVxBmjvY8cL4PG1mxFroJw/0?wx_fmt=png" data-cropx1="0" data-cropx2="14" data-cropy1="0" data-cropy2="22" data-ratio="1.5714285714285714" data-s="300,640" style="text-align: center;width: 14px;height: 22px;" data-type="jpeg" data-w="14" src="https://wechat2rss.xlab.app/img-proxy/?k=bd97b2d0&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4Q2sfuVpzslrABszTf0HMgf91Ku7nKuib2g2ib5icyOW5mffyC17ibmxgCg%2F640%3Fwx_fmt%3Djpeg"/><span style="letter-spacing: 1px;">为在拐点</span><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4HhqMXBH9CMB7ichOjYESS0ibKvKicBMQzKnfypIEQiaIVb4gGaWLicID7Ug/0?wx_fmt=png" data-cropx1="0" data-cropx2="16" data-cropy1="0" data-cropy2="20" data-ratio="1.25" data-s="300,640" style="text-align: center;width: 16px;height: 20px;" data-type="jpeg" data-w="16" src="https://wechat2rss.xlab.app/img-proxy/?k=f347ba69&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd48J0rbEiaI8urCUuL9BduLcCicVDiaYljxYVbTZnT1JpmXZmM7g5ZuU8tQ%2F640%3Fwx_fmt%3Djpeg"/><span style="letter-spacing: 1px;">处增长率k的变化大小。那么在时间t处的增长率k会变为</span><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4ghuxlOg7JS0GkfGqr9nwjc7f9YrKxW39sBF7MnTGQUXq2PibqibhKk8w/0?wx_fmt=png" data-cropx1="0" data-cropx2="89" data-cropy1="0" data-cropy2="22" data-ratio="0.23595505617977527" data-s="300,640" style="text-align: center;width: 89px;height: 22px;" data-type="jpeg" data-w="89" src="https://wechat2rss.xlab.app/img-proxy/?k=c56f1833&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4nPfzH30vmJfhUMicG0qwJicvEveOLv69DQG8M7ibtD2jVVCws4EPfdcKA%2F640%3Fwx_fmt%3Djpeg"/><span style="letter-spacing: 1px;">。为了使用向量表示，引入一个指示向量</span><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4ftC0qKbs5qkMPPmFTHAOFAP8obN5E1pK5QdSVEvLrqnydz5kHxZIhA/0?wx_fmt=png" data-cropx1="0" data-cropx2="91" data-cropy1="0" data-cropy2="18" data-ratio="0.18681318681318682" data-s="300,640" style="text-align: center;width: 91px;height: 17px;" data-type="jpeg" data-w="91" src="https://wechat2rss.xlab.app/img-proxy/?k=8d51df78&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4uhyKplMsW2J2QSicNzkHsaxJtFwcY8mDmUHG8rpJEPicPHSCk9F1NrvQ%2F640%3Fwx_fmt%3Djpeg"/><span style="letter-spacing: 1px;">.</span><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4ZD0ldWEPOTmovQl6upMrqBNbbPy6zzPtAqYjys6J86xyfbKsOy9ribw/0?wx_fmt=png" data-cropx1="0" data-cropx2="95" data-cropy1="0" data-cropy2="25" data-ratio="0.25263157894736843" data-s="300,640" style="text-align: center;width: 95px;height: 25px;" data-type="jpeg" data-w="95" src="https://wechat2rss.xlab.app/img-proxy/?k=c6ba7ca2&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4a4k2DntjXYtemycPITsk2g6jYfq7Nbc1x2XiaYo6RCq3mMYYU1ic8Deg%2F640%3Fwx_fmt%3Djpeg"/><span style="letter-spacing: 1px;">变为</span><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4oqpGXc8xTpzFDuMLicmibwM6oR8PibMWQMiawe2d9oNaGvJP3wbDmrtsMQ/0?wx_fmt=png" data-cropx1="0" data-cropx2="83" data-cropy1="0" data-cropy2="19" data-ratio="0.21686746987951808" data-s="300,640" style="text-align: center;width: 83px;height: 19px;" data-type="jpeg" data-w="83" src="https://wechat2rss.xlab.app/img-proxy/?k=14964cd3&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd43L6lFRotYaprFW4IIZzneofY6BMaYib6snxJWvFwHjX9iad3NZXrNHFA%2F640%3Fwx_fmt%3Djpeg"/><span style="letter-spacing: 1px;"><strong>. </strong>在偏置项的改变上，在<em>j</em>处也可以调整为<strong>：</strong></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.061596480201131364" data-s="300,640" style="" data-type="png" data-w="1591" src="https://wechat2rss.xlab.app/img-proxy/?k=e05f7ede&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd46egRahlDibTAImIia8mC85kc1gGhA8omK3unyGbgexcIiawPGRUk4jsXQ%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;color: rgb(136, 136, 136);"><em><span style="letter-spacing: 1px;color: rgb(136, 136, 136);font-size: 15px;">【至于为什么是这种形式，可以理解为，</span></em><em><span style="letter-spacing: 1px;color: rgb(136, 136, 136);font-size: 15px;"><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4HhqMXBH9CMB7ichOjYESS0ibKvKicBMQzKnfypIEQiaIVb4gGaWLicID7Ug/0?wx_fmt=png" data-cropx1="0" data-cropx2="16" data-cropy1="0" data-cropy2="20" data-ratio="1.25" data-s="300,640" style="height: 20px;white-space: normal;text-align: center;width: 16px;" data-type="jpeg" data-w="16" src="https://wechat2rss.xlab.app/img-proxy/?k=f347ba69&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd48J0rbEiaI8urCUuL9BduLcCicVDiaYljxYVbTZnT1JpmXZmM7g5ZuU8tQ%2F640%3Fwx_fmt%3Djpeg"/></span></em><em><span style="letter-spacing: 1px;color: rgb(136, 136, 136);font-size: 15px;">为当前拐点的时间点，m为一个固定的偏置量，从</span></em><em><span style="letter-spacing: 1px;color: rgb(136, 136, 136);font-size: 15px;"><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4HhqMXBH9CMB7ichOjYESS0ibKvKicBMQzKnfypIEQiaIVb4gGaWLicID7Ug/0?wx_fmt=png" data-cropx1="0" data-cropx2="16" data-cropy1="0" data-cropy2="20" data-ratio="1.25" data-s="300,640" style="height: 20px;white-space: normal;text-align: center;width: 16px;" data-type="jpeg" data-w="16" src="https://wechat2rss.xlab.app/img-proxy/?k=f347ba69&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd48J0rbEiaI8urCUuL9BduLcCicVDiaYljxYVbTZnT1JpmXZmM7g5ZuU8tQ%2F640%3Fwx_fmt%3Djpeg"/></span></em><em><span style="letter-spacing: 1px;color: rgb(136, 136, 136);font-size: 15px;">后退一个偏置量，再将过去拐点未知的扰动量减掉，剩下从语义上来说应为一个本次拐点的扰动大小。之后再利用增长率变化的大小做一个尺度的调整，即为本次拐点位置的扰动量。】</span></em></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><em><span style="font-size: 15px;"><br/></span></em></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">在考虑C和k的动态性之后，原基础的饱和增长模型变化为：</span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.07241379310344828" data-s="300,640" style="" data-type="png" data-w="1160" src="https://wechat2rss.xlab.app/img-proxy/?k=2c9ab45c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4LYWskqS7tSITcRaCQhibwxlhaMtr5sDLZ6GGGfWwMfHn7046icjS462A%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">该模型也为fbprophet拟合中，growth取‘logistic’时的趋势项模型。在使用中，饱和总量C(t)需要事先指定，其他几个参数则有默认取值。除此之外，将logistic函数换为线性函数（或其他函数），即变为趋势模型的线性表示方式：</span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.04358974358974359" data-s="300,640" style="" data-type="png" data-w="1170" src="https://wechat2rss.xlab.app/img-proxy/?k=e63d3371&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4QCsvICfiahFlrP776iaibU1UYboxOHA8Jjo5OxsBQCrk3b7E9aJWybhxg%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">该方法相比logistic趋势而言，虽然看上去简单，但实际使用中发现效果挺好，而且没有饱和总量C的参数。</span><br/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><br/></span></section><section style="text-align: justify;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"> </span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;font-size: 18px;"><strong> 1.2 关于周期分量</strong></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;">fbprophet考虑时间序列中</span><span style="text-indent: 28px;color: rgb(255, 0, 0);">存在多周期</span><span style="text-indent: 28px;">的情况，并利用fourier 变换来进行周期的表示。周期分量的fourier表示形式如下，其中通过配置不同的P和n,可以实现不同尺度的周期表示。一般来说，我们会配置（365.23，10），（7，3）两组参数，来抓住年周期趋势和周周期趋势。</span></span><span style="letter-spacing: 1px;text-align: justify;"> </span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.06297229219143577" data-s="300,640" style="" data-type="png" data-w="1588" src="https://wechat2rss.xlab.app/img-proxy/?k=e86f68c2&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4gJdQDAo4ZeCuWPdOricT0fDeEkt14h07nnL22vZ4c8O8oiaAFYR1CKGg%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><strong><span style="font-size: 19px;font-family: 宋体;"><strong style="text-align: left;white-space: normal;"><span style="font-family: 宋体;"> </span></strong></span></strong></span><span style="letter-spacing: 1px;font-size: 18px;"><strong>1.3 关于节假日分量</strong></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-indent: 28px;">它</span><span style="text-indent: 28px;color: rgb(255, 0, 0);">支持算法人员传入过去和未来的节假日列表</span><span style="text-indent: 28px;">，对于每个节假日，支持配置节假日的影响窗口，例如圣诞前前后各一天都算节假日的影响范围。在每个节假日上，配置对观测值的影响大小，即为</span></span><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4xpAmQKsFOhTlqeKqmMdJOibiarVkL09dllSbnr2iaROzTz05XfzOqibZrg/0?wx_fmt=png" data-cropx1="0" data-cropx2="17" data-cropy1="0" data-cropy2="18" data-ratio="1.125" data-s="300,640" style="text-indent: 28px;text-align: center;width: 17px;height: 18px;" data-type="jpeg" data-w="16" src="https://wechat2rss.xlab.app/img-proxy/?k=e3151026&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4RDATWbW3W8e8bS3pfWpqYuD8gu9bwn78jYc31mXNdVLgFzhAluZiawA%2F640%3Fwx_fmt%3Djpeg"/><span style="text-indent: 28px;letter-spacing: 1px;">, </span><img class="rich_pages" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4yB4SXaHCSlXARm4ibMUbU2EicOUYX52AHaic7vPSTldpsRKh6S7mOicdUg/0?wx_fmt=png" data-cropx1="0" data-cropx2="18" data-cropy1="0" data-cropy2="18" data-ratio="1" data-s="300,640" style="text-indent: 28px;text-align: center;width: 18px;height: 18px;" data-type="jpeg" data-w="18" src="https://wechat2rss.xlab.app/img-proxy/?k=c0a8c104&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4QrhZo1xjtcmwibxOuf7IJKnicRTicPE8zOTufO973wruZwSDM3Yjl1ZBQ%2F640%3Fwx_fmt%3Djpeg"/><span style="letter-spacing: 1px;"><span style="text-indent: 28px;">表示第</span><em style="text-indent: 28px;">i</em><span style="text-indent: 28px;">个节假日的区间。我们假设服从均值为0，方差为的正态分布。</span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="text-align: left;text-indent: 28px;letter-spacing: 1px;">节假日的分量可以如下表示：</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="text-align: left;text-indent: 28px;letter-spacing: 1px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="text-align: left;text-indent: 28px;letter-spacing: 1px;"><img class="rich_pages" data-ratio="0.04095004095004095" data-s="300,640" style="text-align: center;white-space: normal;" data-type="png" data-w="1221" src="https://wechat2rss.xlab.app/img-proxy/?k=b9c588a2&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4KXkCnuRxj7FMmficmBNHnia0YkjC87C6Gv5QkT9hibNEOJPx8atmiaLaaQ%2F640%3Fwx_fmt%3Dpng"/></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.2956521739130435" data-s="300,640" style="width: 78px;height: 23px;" data-type="png" data-w="115" src="https://wechat2rss.xlab.app/img-proxy/?k=f10ed9dd&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4gvWkibGOtkCKHHktJuyhBXsSa955e9WuibOg609fuicycOEoDajNvlUjA%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="text-align: left;text-indent: 28px;letter-spacing: 1px;">在模型建立之后，在模型训练阶段，fbprophet方法利用stan’s LBFGS方法进行优化求解。</span></section><section style="text-indent: 28px;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"> </span></section><section style="margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><strong>关于调优tips：</strong></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">容量C：在选择饱和增长模型的时候，容量C必须配置，具体的取值依赖业务知识（相比arima方法等，这种调参成本很低）</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">拐点：拐点可以选择主动传入，也可以自动选择，自动选择的情况下，默认从前80%的点中，等距的选择25个点作为拐点。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">节假日和周期性：依赖业务经验，一般而言，可以依赖可视化来进行模型调优。（把曲线画出来，看下大概是什么样的周期，节假日变点在哪里）</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">平滑参数：算法人员通过调节τ，v，δ 3个参数来控制拟合曲线的平滑度。</span></section><section style="margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><strong><span style="font-size: 21px;">2. 效果评测</span></strong></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="text-align: left;text-indent: 28px;letter-spacing: 1px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-align: left;text-indent: 28px;">lstm方法是深度学习方法中针对时间序列的经典方法，对比fbprophet方法而言，它没有建模过程，直接从历史观测序列中学习拟合。此处对lstm方法不做介绍，仅仅把它的结果和fbprophet方法做个对比。<br/></span></section><table cellspacing="0" cellpadding="0"><tbody><tr><td valign="top" colspan="1" rowspan="1" style="word-break: break-all;"><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.75" data-s="300,640" style="" data-type="png" data-w="236" src="https://wechat2rss.xlab.app/img-proxy/?k=301bd194&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4PzT20EibymW1cRqRiazdc0QkUq9ordfJzqFfYYuOXZRhYyPicHtIKkxqw%2F640%3Fwx_fmt%3Dpng"/></section></td><td valign="top" colspan="1" rowspan="1" style="word-break: break-all;"><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.7478991596638656" data-s="300,640" style="" data-type="png" data-w="238" src="https://wechat2rss.xlab.app/img-proxy/?k=c2c649d7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4mK0ngtQAqxtCDQeic2TbIib20upKkvN4Iu7QbdF1wPvhciayicE2LuYpHg%2F640%3Fwx_fmt%3Dpng"/></section></td></tr><tr><td width="276" valign="top" style="padding: 0px 7px;"><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">Lstm  拟合预测（10000次）</span></section></td><td width="276" valign="top" style="padding: 0px 7px;"><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">Fbprophet方法（无调参）</span></section></td></tr></tbody></table><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;">图2 效果评测对比</span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"> </span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-align: left;text-indent: 28px;">从预测效果上看，</span><span style="text-align: left;text-indent: 28px;color: rgb(255, 0, 0);">lstm预测效果比fpprophet要好，实验中lstm的mse值在0.21，而fbprophet方法的mse在0.25。但是在训练时间上，lstm在无GPU的机器上，训练用了2.5小时，而fbprophet方法在默认参数下，分钟级别完成训练和预测。</span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-align: left;text-indent: 28px;color: rgb(255, 0, 0);"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="text-align: left;text-indent: 28px;letter-spacing: 1px;color: rgb(0, 0, 0);">在UEBA的实践中，针对“设备外发数据量检测”，“用户访问资源数量检测”，基于该方法都取得了较好的效果，从中也体会到该方法善于抓住周期、趋势和突变的优点，极大的降低了误报。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><strong><span style="font-size: 21px;">3. 小结</span></strong></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="text-align: left;text-indent: 28px;letter-spacing: 1px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-align: left;text-indent: 28px;">UEBA中的很多场景涉及到时间序列检测问题，在业界的大多数实现方案中，可以通过k-sigma，box-plot，esd,s-esd, wavelet, fourier decomposion等多种方法来进行检测。</span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-align: left;text-indent: 28px;"><br/></span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-align: left;text-indent: 28px;">但实际中，发现简单的模型会带来比较多的误报，而复杂的模型又没有办法在有限的资源中进行全量检测。</span></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><br/></section><section style="margin-left: 16px;margin-right: 16px;"><br/></section><section style="margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><span style="text-align: left;text-indent: 28px;">因此，</span><span style="text-align: left;text-indent: 28px;color: rgb(255, 0, 0);">在算法的实际落地中，我们在UEBA中多采用层次检测和集成检测两种思路，层次检测指的是搭建多个简单模型对全量数据进行粗筛，之后在用性价比高、可解释性好的模型进行精准检测，在某些场景中，我们也会采用多个算法集成输出的思路，以提高检测的有效性和准确性。</span><br/></span></section><section style="margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-indent: 28px;text-align: left;margin-left: 16px;margin-right: 16px;"><br/></section><section style="margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"> </span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;"><strong>附录：自动选择拐点的方法<br/></strong></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;">拐点作为该方法的亮点之一，此处附加fbprophet方法中关于拐点的选择逻辑。</span><span style="letter-spacing: 1px;text-indent: 28px;">该算法原文中提到，算法人员可以主动提供拐点（可以通过将时间序列画出来，拿到拐点，传入算法模型）；也可以根据业务经验粗略的定拐点（例如一年中的节假日、产品活动日等）。最后也可以由算法自动的进行拐点的选择。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-indent: 28px;">在自动选择拐点的模式下，算法人员传入对δ的一个稀疏先验，并假设该稀疏先验服从参数为（0,τ）的拉普拉斯分布。τ在调参上的含义主要是用来控制在增长率改变上的灵活度，如下，拉普拉斯分布在中间部分的集中度是不一样的，在集中度比较小的时候，对τ有较大的概率采样到一个较大的值，自动选择拐点的逻辑具体如下：</span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.7490774907749077" data-s="300,640" style="" data-type="png" data-w="271" src="https://wechat2rss.xlab.app/img-proxy/?k=c91be9fa&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4fgdZFoia9IRIicD2IkQjbIX4k4bR09xgJe4TiavE7ZR7o8ksD9gGUQJqA%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-align: left;text-indent: 28px;"><br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-align: left;text-indent: 28px;">假设T个点中有S个拐点，每个拐点服从一个参数为（0,τ）的拉普拉斯分布。在预测的情况下，我们模拟未来增长率的改变，通过将τ替换为一个从数据中推测得到的数值。这个数值使用过去拐点处增长率改变的均值。在预测未来走势的时候，拐点是按如下方式采样得到。<br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-align: left;text-indent: 28px;"><br/></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages" data-ratio="0.11308562197092084" data-s="300,640" style="" data-type="png" data-w="1238" src="https://wechat2rss.xlab.app/img-proxy/?k=c1c492e7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4csicxTia5sCIThqFz9mvibicPAs8O9cd9U3mVl6L4TicVy2nFvcbPbKjeeQ%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-align: left;text-indent: 28px;">这里有个假设是在增长率的改变上，未来会有与过去相同的平均频率和幅值。当增大<span style="letter-spacing: 1px;text-align: left;text-indent: 28px;">τ</span>的时候，训练误差会降低。</span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="letter-spacing: 1px;text-align: left;text-indent: 28px;"><br/></span></section><hr style="border-style: solid;border-width: 1px 0 0;border-color: rgba(0,0,0,0.1);-webkit-transform-origin: 0 0;-webkit-transform: scale(1, 0.5);transform-origin: 0 0;transform: scale(1, 0.5);"/><section style="text-align: center;margin-left: 16px;margin-right: 16px;">最后，小编给各位大大准备了个彩蛋</section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;">噔噔噔噔~</section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;">腾讯御见安全中心牛年定制限量红包封面！</section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages js_insertlocalimg" data-ratio="1.6143497757847534" data-s="300,640" style="height: 354px;text-align: center;white-space: normal;width: 219px;" data-type="png" data-w="669" src="https://wechat2rss.xlab.app/img-proxy/?k=263468e5&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4jEBr70NTjJIATQibKPIGY646AbMPORiarNDGa0ugwIHHZrvFBEibNjlLg%2F640%3Fwx_fmt%3Dpng"/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="text-align: center;">扫描下方二维码可领取</span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img class="rich_pages js_insertlocalimg" data-croporisrc="https://mmbiz.qlogo.cn/mmbiz_png/PS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4H8ztAYA3vRJibYy8lQrUjicx0iaaznbb6dYKkSN40DvWeHOBSCX9RpqzQ/0?wx_fmt=png" data-cropx1="51.65625" data-cropx2="348" data-cropy1="36.703125" data-cropy2="345.28125" data-ratio="1.0437710437710437" data-s="300,640" style="width: 218px;height: 227px;" data-type="jpeg" data-w="297" src="https://wechat2rss.xlab.app/img-proxy/?k=59670e2d&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavRTgLWvlGzPoqKRznJvKdd4l85vib2fEF0xaXhvLqRHOdzBZQB0RqjwCX2Dw0co8UpicC3tDSS5NcUw%2F640%3Fwx_fmt%3Djpeg"/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;">数量有限，快来领取吧<br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;">祝大家牛年新年快乐！牛气冲天！牛转乾坤！</section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><hr style="border-style: solid;border-width: 1px 0 0;border-color: rgba(0,0,0,0.1);-webkit-transform-origin: 0 0;-webkit-transform: scale(1, 0.5);transform-origin: 0 0;transform: scale(1, 0.5);"/><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="font-size: 16px;"><strong>智能化 自动化 一站式</strong></span></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><img data-w="258" data-type="jpeg" data-ratio="1" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/><br/></section><section style="text-align: center;margin-left: 16px;margin-right: 16px;"><span style="font-size: 16px;color: rgb(53, 53, 53);font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;text-align: start;background-color: rgb(255, 255, 255);letter-spacing: 1px;">（长按二维码快速扫描关注）<br/></span></section><section style="text-align: left;margin-left: 16px;margin-right: 16px;"><span style="color: rgb(53, 53, 53);font-family: -apple-system, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;text-align: start;background-color: rgb(255, 255, 255);letter-spacing: 1px;font-size: 16px;">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。欢迎关注~</span></section><section style="margin-left: 16px;margin-right: 16px;"><br/></section><section style="margin-left: 16px;margin-right: 16px;"><br/></section><section style="margin-left: 16px;margin-right: 16px;"><br/></section>



<p><a href="2247484259">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=6cf50991&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484259%26idx%3D1%26sn%3D17a397fd81cee37fade72afc74ae03f9%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Tue, 09 Feb 2021 14:53:00 +0800</pubDate>
    </item>
    <item>
      <title>UEBA（用户实体行为分析）内部风险</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484182&amp;idx=1&amp;sn=3634bcace36f0f886b21f96b5c84f247</link>
      <description>目前我们御见UEBA产品最新版本已经发布，上一篇文章我们结合UEBA背后的技术行了简单介绍，本文将对UEBA内部风险相关场景进行介绍，有兴趣欢迎交流。</description>
      <content:encoded><![CDATA[<p>
原创 <span>御见UEBA团队</span> <span>2020-08-10 12:00</span> <span style="display: inline-block;"></span>
</p>

<p>目前我们御见UEBA产品最新版本已经发布，上一篇文章我们结合UEBA背后的技术行了简单介绍，本文将对UEBA内部风险相关场景进行介绍，有兴趣欢迎交流。</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=6a1677ab&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavQM8r7xNZ5IbUE7jIqcJbudgibe3ULWILSOUmlRicrOUEkE9ebS00tyRtrWxbLtia5W8qicVb7hUe3sWg%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p><span style="font-size: 16px;"><span style="font-family: 宋体;"><span style="font-family: 宋体;">引子：腾讯御见</span>UEBA<span style="font-family: 宋体;">（用户实体行为分析）面向政企办公安全、数据安全治理、员工行为管理，使用一系列分析方法（统计学习、机器学习等</span></span><span style="font-family: 宋体;">高级分析方法</span><span style="font-family: 宋体;">）通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建</span><strong><span style="font-family: 宋体;">用户实体画像</span></strong><span style="font-family: 宋体;">（静态画像、动态画像），然后基于用户实体画像进行</span><strong><span style="font-family: 宋体;">风险检测、风险分析、风险评估，</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">最终识别内部风险用户和风险实体。御见</span>UEBA<span style="font-family: 宋体;">是单独的解决方案或产品，也可以作为一种高级分析能力或模块嵌入到御见</span><span style="font-family: Calibri;">SOC</span><span style="font-family: 宋体;">中。目前我们御见</span><span style="font-family: Calibri;">UEBA</span><span style="font-family: 宋体;">产品最新版本已经发布，上一篇文章我们结合</span>UEBA<span style="font-family: 宋体;">背后的技术行了简单介绍，本文将对</span></span><strong><span style="font-family: 宋体;">UEBA<span style="font-family: 宋体;">内部风险相关场景</span></span></strong><span style="font-family: 宋体;">进行介绍，有兴趣欢迎交流。</span></span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;font-weight: bold;">1. </span><strong><span style="font-family: 宋体;">Gartner对UEBA场景的分析</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">Gartner认为UEBA随着新的场景出现，主要的一些场景也正在巩固稳定。UEBA解决方案可以支持多种场景。Gartner认为UEBA一些场景，包括监控未授权数据的访问和移动，可疑的权限用户行为，恶意的或未授权的员工行为。UEBA还监控不正常的云资源访问和使用，并且支持对现有的一些产品做更好的检测，例如CASB和IAM。除此之外，UEBA解决方案有时候还能被用作分析一些典型的非网络安全的场景，例如欺诈或者员工监控。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">Gartner描述了5大类主要的场景：</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">1）<span style="font-family: 宋体;">恶意内部员工</span></span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></strong></span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;">这类场景主要监控员工和外部合作方是否存在异常、恶意或滥用行为。此类场景不会监控分析服务账号或者其他非人为实体，并不面向检测高级威胁，目的只是识别从事恶意活动的内部人员。</span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align:left;"><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;">本质上，恶意内部威胁是有意损坏公司或组织利益的受信任用户。因为用户恶意的意图不好评估，所以需要从日志中抽取上下文进行行为分析。</span></p><p style="text-align:left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">2）失<span style="font-family: 宋体;">陷内部员工和高级威胁</span></span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;text-indent: 28px;font-family: 宋体;">这类场景是指一旦攻击者渗透到组织中并在内部横向移动，就可以快速检测和分析恶意活动。众所周知，高级持续性威胁（APT）和未知威胁（例如0-day攻击）很难被发现，并且通常藏在合法用户或服务帐户之后。这些威胁通常具有复杂的模式，或者其恶意行为还没有被发现过。这使它们难以通过简单的分析（例如模式匹配，阈值或相关规则）进行检测。</span></p><p style="text-align:left;"><span style="font-size: 16px;text-indent: 28px;font-family: 宋体;"><br/></span></p><p style="text-align:left;"><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;">但是这些高级威胁中的许多威胁会使得资产的行为与正常行为不同，通常会利用毫无戒心的用户和身份，即受害内部人员。UEBA技术提供一种方法来检测这些威胁，提高信噪比，合并和减少警报量，对剩余警报进行优先级排序以及促进有效的响应和调查。</span></p><p style="text-align:left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">3）<span style="font-family: 宋体;">数据外泄</span></span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;">这类场景检测组织中数据的泄漏。此场景通常通过异常检测和高级分析来增强DLP或数据访问管理系统，从而提高其信噪比减少告警量， 并优先处理剩余的告警。</span></p><p style="text-align:left;"><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;"><br/></span></p><p style="text-align:left;"><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;">对于其他情况，它们倾向于与网络流量（例如，Web代理）和终端数据集成，并更多地依赖它们，因为对这些数据源的分析可以阐明数据渗漏活动，数据泄露检测用于捕获威胁组织的内部人员和外部黑客。</span></p><p style="text-align:left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">4）<span style="font-family: 宋体;">身份和权限访问管理</span></span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></strong></span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;">这类场景主要监控访问权限和分析用户行为，以识别特权或异常访问。这适用于所有类型的用户和帐户，包括特权用户和服务帐户。组织还可以使用UEBA来清理休眠帐户和用户不必要的权限。</span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">5）<span style="font-family: 宋体;">事件优先级</span></span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;font-family: 宋体;"><span style="font-family: 宋体;">这类场景的目标是帮助组织确定生成的警报的优先级，并提供有关应优先处理哪些事的指导。</span> <span style="font-family: 宋体;">在这种情况下，</span>UEBA<span style="font-family: 宋体;">引擎不仅会使用基线模型和威胁模型，而且通常会使用组织的结构信息（例如，资产的关键性以及人员的角色和访问级别）来丰富基准和威胁模型。</span></span></p><p><br/></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;font-weight: bold;">2. </span><strong><span style="font-family: 宋体;">UEBA内部风险</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;font-family: 宋体;"><span style="font-family: 宋体;">从</span>Gartner对UEBA主要场景的分析能看出，UEBA主要关注的典型场景是恶意员工风险、失陷员工风险、账号权限管理、数据泄露、告警优先级等，主要是企业内部风险。御见UEBA一方面覆盖这些典型的UEBA场景；另一方面针对客户业务、梳理应用接口、监控应用运行状态，保障客户环境<span style="font-family: 宋体;">账号安全、办公安全、数据安全和业务安全。下面主要对</span>UEBA主要的场景内部风险进行简单介绍。</span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">1）内部风险定义</span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">内部风险主要是企业内部用户引起的安全风险。</span><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">内部用户包括：</span><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">在职员工；</span><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">离职员工；</span><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">合作方；</span><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">供应商等等。</span><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">主要通过行为分析识别违规用户，失陷用户，恶意用户等等。</span></p><p><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;"><br/></span></p><p><strong><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">恶意用户：</span></strong><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;"></span><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">对于恶意的内部人员，用户通常是有目的的行为，知道本身的行为可能会对企业造成损害。</span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p><strong><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">违规用户：</span></strong><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"></span><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">企业内部员工可能会出现的一些有意无意的违规行为，也可能对企业造成一定的损害，例如存在账号共享、违规操作等等。</span></p><p><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;"><br/></span></p><p><strong><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">失陷用户</span></strong><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">：</span><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">企业内部员工可能由于钓鱼邮件或所属设备失陷等导致凭证外泄，攻击者会通过合法的凭证在企业内部做恶意活动而很难被发现。</span><br/></p><p><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.6652421652421653" data-s="300,640" style="" data-type="png" data-w="702" src="https://wechat2rss.xlab.app/img-proxy/?k=756da98e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQM8r7xNZ5IbUE7jIqcJbudMN2IJ348I3ktIwod92rBrLtX1DD06erImibOjyzGf4buNp5dbE0ac1w%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;font-weight: bold;">2）</span><strong><span style="font-family: 宋体;">内部风险原因：</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">下面列了部分可能引起内部风险的原因。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">* 内部员工相关岗位有不适当的访问权限：</span></p><p><span style="font-family: 宋体;font-size: 16px;">* 内部员工转岗等情况没有因为更换角色而及时撤销权限；</span></p><p><span style="font-size: 16px;font-family: 宋体;">* 离职员工仍然能远程访问敏感应用或服务器。</span></p><p><span style="font-size: 16px;font-family: 宋体;">* 内部员工对敏感数据有高权限，但是有恶意企图。</span></p><p><span style="font-size: 16px;font-family: 宋体;">* 企业内部敏感数据越来越多：财务报告；客户数据；产品或技术文档；员工数据等。</span></p><p><span style="font-size: 16px;font-family: 宋体;">* 办公全球化增加了数据外泄可能，内部员工的办公地点不局限在本地，能更容易在任何时候任何地点通过VPN,智能网关等工具访问企业内部敏感数据。</span></p><p><span style="font-size: 16px;font-family: 宋体;">* 操作不规范如员工之间共用凭证等行为，也会给企业带来一定的隐患。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;font-weight: bold;">3）</span><strong><span style="font-family: 宋体;">UEBA内部风险场景</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-size: 16px;font-family: 宋体;"><span style="font-family: 宋体;">御见</span>UEBA内置了多种风险场景，例如：账号风险、研发凭证外泄风险、离职员工权限风险、内部数据窃取、研发数据泄露风险、<span style="font-family: 宋体;">内部业务运行风险，下面对这些场景进行简单介绍。</span></span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">① </span></strong><strong><span style="font-family: 宋体;">账号风险</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">账号风险主要是指由于内部员工账号引起的风险，例如：账号共享，账号失陷，静默账号等等。</span></p><p><strong><span style="font-family: 宋体;font-size: 16px;"><br/></span></strong></p><p><strong><span style="font-family: 宋体;font-size: 16px;">账号失陷：</span></strong><span style="font-family: 宋体;font-size: 16px;">攻击者通过钓鱼邮件，暴力破解，漏洞等方式获取用户的凭证，导致用户账号失陷。进而攻击者通过用户合法的账号访问企业内部应用或数据。及时检测识别账号失陷风险能在引起更严重后果之前进行阻止。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><strong><span style="font-family: 宋体;font-size: 16px;">账号共享：</span></strong><span style="font-family: 宋体;font-size: 16px;">内部员工将自己访问数据、应用、资产等的凭证，共享给其他并没有访问权限的员工使用，引起账号共享风险。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">账号风险的检测，可以提取账号相关画像特征（例如时间戳，位置，IP，设备等等），通过机器学习算法，以识别与特定帐户正常行为的任何偏差，并相应的响应。这有助于根据异常行为模式来检测任何潜在的帐户泄露或劫持情形，例如：对高风险或敏感对象的异常访问，异常的活动数量，短时间内的请求，来自终止的用户帐户的活动或休眠帐户。通过时间序列或行为分析的机器学习模型识别与用户或同类的正常行为不一致的异常，将基于高级安全分析获得风险评分，风险评估。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">优点：</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">* 通过行为分析检测账号未知的行为异常进而识别账号共享，账号失陷，休眠账号等，而不是通过规则、白名单的方面检测已知威胁等。</span></p><p><span style="font-family: 宋体;font-size: 16px;">* 提供了全面的用户账号行为可视化，全局视角审核异常账号，休眠账号等等。</span><br/></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">②</span></strong><strong><span style="font-family: 宋体;"> <span style="font-family: 宋体;">权限滥用</span></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">权限滥用通过账号、访问等多种数据关联识别高权限访问滥用行为。一般会从IAM或其他账号权限系统提取账号及访问数据，以识别特权用户以及被授予高权限的普通用户。基于这些数据，UEBA可以检测到可疑行为和滥用行为，例如：使用特权账号为普通账号分配特殊或提升的特权，然后对敏感数据访问。这些异常访问同样会体现在不同的IP，设备，位置异常等等。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">优点：</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">* 识别高权限账号，高权限账号行为全面可视。</span></p><p><span style="font-family: 宋体;font-size: 16px;">* 检测高权限账号滥用行为，减少风险。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">③</span></strong><strong><span style="font-family: 宋体;"> <span style="font-family: 宋体;">数据外泄</span></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">敏感数据外泄会对企业造成严重的损失，UEBA通过企业内部业务信息或DLP日志获取敏感数据或应用，结合应用访问等数据，监控敏感数据或应用的访问行为，从而识别数据泄露保护企业数据安全。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">数据外泄的主要方式有两种，一种通过接口访问拉取敏感数据，另一种本地访问移动copy外发敏感数据。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">UEBA针对通过接口访问拉取敏感数据的情况，分析用户访问敏感数据日志，监控用户访问行为，通过机器学习的方法比较历史基线和同类基线，如行为偏离基线，则识别为访问敏感数据异常风险。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">UEBA针对本地敏感数据访问移动copy外发等行为，分析DLP日志，确定DLP告警优先级，降低误报，优先重要告警，同时为用户访问行为提供丰富上下文，便于运营人员更快更直接识别到风险，及时做出反馈，减少企业损失。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">UEBA提供了可配置的基线建模平台，方便对敏感数据监控任务的配置及及时检测识别。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">优点：</span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">* 通过自学习机器学习模型提供数据访问行为基线，识别敏感数据异常访问。</span></p><p><span style="font-family: 宋体;font-size: 16px;text-indent: 28px;">* 通过风险权重风险评分显著减少DLP告警数量，节省调查时间，降低误报。</span></p><p style="text-indent:28px;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">④</span></strong><strong><span style="font-family: 宋体;"> <span style="font-family: 宋体;">业务运行风险</span></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></strong></span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;">对企业来说，业务的正常运行极为重要。UEBA除了监控用户行为，用户访问业务行为以外，还会梳理企业业务接口，全面可视化化业务接口运行情况。而且通过时间序列等机器学习的方法监控业务访问量是否异常，业务访问用户量是否异常，访问失败数异常，接口是否失活等等。使得企业全面了解业务，及时发现业务运行风险，保障业务正常运行。</span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">优点：</span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;">* 梳理企业业务，全面可视化业务运行情况。</span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;">* 通过时间序列等机器学习模型，实时监控业务运行状况，及时识别业务运行异常。</span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align:left;"><span style="font-size: 16px;"><span style="font-family: 宋体;font-weight: bold;">3. </span><strong><span style="font-family: 宋体;">结论</span></strong></span></p><p style="text-align:left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;">御见UEBA为了保障企业账号安全、办公安全、数据安全和业务安全，内置覆盖了典型的UEBA场景，一方面全面可视企业内部员工行为、企业业务接口运行状况，另一方面通过机器学习平台基于多源行为数据对用户和应用构建基线，进一步识别未知的行为异常，快速识别发现风险用户及风险应用，为企业内部安全保驾护航。</span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;">除了内置的场景以外，客户还可以通过可配置的机器学习平台快速实现特殊业务场景的分析、检测及监控，在运营过程中不断完善丰富UEBA场景。</span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><img class="rich_pages" data-ratio="1" data-s="300,640" data-type="jpeg" data-w="258" style="box-sizing: border-box !important;overflow-wrap: break-word !important;width: 258px !important;visibility: visible !important;" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-size: 14px;letter-spacing: 0.544px;text-align: left;box-sizing: border-box !important;overflow-wrap: break-word !important;">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。欢迎关注~</span></p><p style="text-align:left;"><span style="font-family: 宋体;font-size: 16px;"><br/></span><br/></p><p style="text-indent: 28px;"><span style="font-size: 16px;"><br/></span></p>



<p><a href="2247484182">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=421a052a&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484182%26idx%3D1%26sn%3D3634bcace36f0f886b21f96b5c84f247%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 10 Aug 2020 12:00:00 +0800</pubDate>
    </item>
    <item>
      <title>腾讯御见UEBA背后的技术</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484176&amp;idx=1&amp;sn=618cea754b370200440b0645754dddc7</link>
      <description>目前我们御见UEBA产品最新版本已经发布，上一篇文章我们结合最新版本对御见UEBA产品进行了简单介绍，本文将对腾讯御见UEBA相关技术进行介绍，有兴趣欢迎交流。</description>
      <content:encoded><![CDATA[<p>
<span>御见UEBA团队</span> <span>2020-07-28 12:00</span> <span style="display: inline-block;"></span>
</p>

<p>目前我们御见UEBA产品最新版本已经发布，上一篇文章我们结合最新版本对御见UEBA产品进行了简单介绍，本文将对腾讯御见UEBA相关技术进行介绍，有兴趣欢迎交流。</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=ac2d455a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmKfWSgichUnBbicHNYGQyZTIWzibmmawRgEkmiafjnUErz5xibghZz1VfbRw%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p style="text-align:left;"><span style="font-family: 宋体;font-size: 12px;"> <strong>引子：</strong></span><span style="font-size: 14px;font-family: 宋体;"></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">腾讯御见</span>UEBA<span style="font-family:宋体;">（用户实体行为分析）面向政企办公安全、数据安全治理、员工行为管理，使用一系列分析方法（统计学习、机器学习等</span></span><strong><span style="font-size: 12px;font-family: 宋体;">高级分析方法</span></strong><span style="font-size: 12px;font-family: 宋体;">）通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建</span><strong><span style="font-size: 12px;font-family: 宋体;">用户实体画像</span></strong><span style="font-size: 12px;font-family: 宋体;">（静态画像、动态画像），然后基于用户实体画像进行</span><strong><span style="font-size: 12px;font-family: 宋体;">风险检测、风险分析、风险评估，</span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">最终识别内部风险用户和风险实体。御见</span>UEBA<span style="font-family:宋体;">是单独的解决方案或产品，也可以作为一种高级分析能力或模块嵌入到御见</span><span style="font-family:Calibri;">SOC</span><span style="font-family:宋体;">中。目前我们御见</span><span style="font-family:Calibri;">UEBA</span><span style="font-family:宋体;">产品最新版本已经发布，上一篇文章我们结合<strong>最新版本</strong>对御见</span><span style="font-family:Calibri;">UEBA</span><span style="font-family:宋体;">产品进行了简单介绍，本文将对腾讯御见</span><span style="font-family:Calibri;">UEBA</span><strong><span style="font-family:宋体;">相关技术</span></strong><span style="font-family:宋体;">进行介绍，有兴趣欢迎交流。</span></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.6609029779058597" data-s="300,640" style="" data-type="png" data-w="1041" src="https://wechat2rss.xlab.app/img-proxy/?k=02411f82&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmSwqDgBcPd1n26gJTzZRZhwiajgSYJbj9rdXW1jHLWI7L68EiaHoD4DKQ%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><h1><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;">一：御见</span>UEBA<span style="font-family:宋体;">技术架构</span></span></strong></h1><p><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;"><br/></span></span></strong></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">御见</span>UEBA<span style="font-family:宋体;">技术架构</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">如下图所示，主要包括</span>3<span style="font-family:宋体;">个部分：数据采集，智能检测分析平台，行为风险评估。</span><span style="font-family:Calibri;">UEBA</span><span style="font-family:宋体;">采集多源数据例如登录日志，访问日志，其他安全产品日志，流量数据等，并对多源日志进行关联、分析、检测，基于行为分析等多种方法识别政企内部的用户风险和业务风险。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.5" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=0c6061f9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmLzjYnqic2VruiahSQ5MKHS5ll53pwicWWIKwhyGiateytSMEjpVORaiaDxA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p><strong><span style="font-family: 宋体;font-size: 14px;">1. <span style="font-family:宋体;">数据采集</span></span></strong></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;">UEBA<span style="font-family:宋体;">采集的数据源主要有三类：登录日志；访问日志；其他日志。</span></span></p><p style="text-indent:28px;"><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">登录日志：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">主要记录用户认证登录业务、系统或应用的行为日志。例如：</span>IAM<span style="font-family:宋体;">统一认证登录日志，</span><span style="font-family:Calibri;">IOA</span><span style="font-family:宋体;">登录认证日志，</span><span style="font-family:Calibri;">VPN</span><span style="font-family:宋体;">日志，核心业务登录日志，</span><span style="font-family:Calibri;">AD</span><span style="font-family:宋体;">日志，</span><span style="font-family:Calibri;">LDAP</span><span style="font-family:宋体;">日志等等；</span></span></p><p style="text-indent:28px;"><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">访问日志：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">主要记录用户认证登录成功后访问业务、系统或应用产生的行为日志。例如：里约网关访问日志，</span>IOA<span style="font-family:宋体;">应用访问日志，堡垒机日志，数据库审计日志，门禁日志，其他核心业务访问日志等等；</span></span></p><p style="text-indent:28px;"><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">其他日志：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">主要包括其他安全产品日志，流量日志。例如：</span>DLP<span style="font-family:宋体;">日志，</span><span style="font-family:Calibri;">IOA</span><span style="font-family:宋体;">日志，威胁情报，</span><span style="font-family:Calibri;">flow</span><span style="font-family:宋体;">数据，其他安全产品日志等等。</span></span></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span></p><p><strong><span style="font-family: 宋体;font-size: 14px;">2. <span style="font-family:宋体;">智能检测分析平台</span></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">智能检测分析平台为</span>UEBA<span style="font-family:宋体;">提供了主要的关联检测分析能力，一方面智能检测模块在产品上以可配置的基线建模平台的形式提供了画像体系构建、行为建模能力；另一方面智能分析模块根据场景进行风险检测、风险评估，并且基于风险评估结果进行动态打分，最终用户实体将以风险分数排序的方式展示给运营人员。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">智能检测和智能分析将通过自适应学习、在线学习、离线学习、集成学习、强化学习等方式学习预测。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span></p><p><strong><span style="font-family: 宋体;font-size: 14px;">3. <span style="font-family:宋体;">行为风险评估</span></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">行为风险评估主要包括根据特定场景风险评估和用户实体综合风险打分。特定场景风险主要对用户进行恶意用户分析、失陷用户分析、违规用户分析、离职员工风险分析，对业务进行业务滥用分析、数据泄露分析、业务异常分析、业务运行状态监控等分析，最后综合所有的特定场景风险以用户实体的维度综合风险评分。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span></p><h1><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;">二：智能检测分析平台</span> </span></strong></h1><p><strong><span style="font-family: 宋体;font-size: 19px;"><br/></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">智能检测分析平台为</span>UEBA<span style="font-family:宋体;">提供了主要的关联检测分析能力，智能检测分析平台主要包括</span><span style="font-family:Calibri;">4</span><span style="font-family:宋体;">大部分：画像体系，行为建模，自适应风险评估，层次动态打分。智能检测分析平台首先关联多源日志构建画像体系，然后基于完备的画像体系进行行为建模，通过行为建模对用户实体进行行为风险评估，最终将所有用户实体风险事件送入层次动态打分机制，完成用户实体的最终风险评分。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.47109375" data-s="300,640" style="width: 539px;height: 254px;" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=5c42d05d&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmYqVul3lGdbfjxwib5GNWQ4tZRc45MNpgBOykx0O10kjChFNnicd0bg1g%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><h2><strong><span style="font-family: 黑体;font-size: 16px;">1. <span style="font-family:黑体;">画像体系</span></span></strong></h2><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">御见</span>UEBA<span style="font-family:宋体;">分析的对象主要包括用户、设备、资产、应用等等，当多源日志接入以后会自动构建用户实体画像体系，持续丰富更新用户实体的</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">静态画像和动态画像</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">用户实体静态画像：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">及时更新维护用户实体的静态信息，例如：用户身份、部门、岗位、权限、账号；设备归属；资产身份及重要性；应用敏感度等等。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">用户实体动态画像：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">持续监控用户实体行为建立动态画像。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于S</span>park<span style="font-family:宋体;">计算引擎</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">实时监控</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">用户实体的行为统计提取行为特征，并通过</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">机器学习算法</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于分析对象行为特征建立历史基线画像、同类画像及动态分组；分析对象的行为不是静态不变而是随着时间动态变化的，统计画像、历史基线画像和同类画像就构成了分析对象的动态画像，用来刻画分析对象的动态个性。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">动态画像例如：用户访问敏感数据的历史频次等等；用户当天访问某个资产的时间，地点，操作行为等等；资产与其他资产通信情况或用户访问资产情况等等；设备当前登录次数，使用状态等等。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="1.0490307867730901" data-s="300,640" style="width: 340px;height: 357px;" data-type="png" data-w="877" src="https://wechat2rss.xlab.app/img-proxy/?k=1d4aa1e8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmPwFAXc5XBLk56aCjicJjg53awnSQw25nvViaItfHM1S9bM6ddGb7Jsmg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><h2><strong><span style="font-family: 黑体;font-size: 16px;">2. <span style="font-family:黑体;">行为建模</span></span></strong></h2><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">画像体系构建，一方面实时更新一方面送入行为建模。因为接入海量的多源日志数据并且对每个用户和实体进行实时监控，单机有性能瓶颈问题所以我们基于大数据计算引擎</span>Spark<span style="font-family:宋体;">搭建了行为基线建模平台（可配置的基线建模平台），并且支持</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">简单拖拽（不用编写代码）</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">即可快速完成行为建模调试及生成环境上线。可配置的基线建模平台数据流图如下图所示，</span>Spark<span style="font-family:宋体;">读取多源数据，经过预处理、数据转换、特征提取、</span><span style="font-family:Calibri;">AI</span><span style="font-family:宋体;">引擎、可解释性模块、决策引擎，完成整个行为基线建模流程。下面将通过基线建模、可解释性、时间序列、行为分析等方面介绍。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.5235478806907379" data-s="300,640" style="" data-type="png" data-w="1274" src="https://wechat2rss.xlab.app/img-proxy/?k=6e830d8c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmkakKrDCcBic758gXeS659xDJyPwVnTDTeVTeicjLgMFYU1bH1fHiaIInw%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="text-align: justify;font-family: Calibri;font-weight: bold;font-size: 14px;">1) </span><strong style="font-size: 16px;text-align: justify;"><span style="font-family: 宋体;font-size: 14px;">分布式单体基线建模/群体基线建模</span></strong></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.4394957983193277" data-s="300,640" style="" data-type="png" data-w="1190" src="https://wechat2rss.xlab.app/img-proxy/?k=2781e299&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmMQxicjOiaCic4FTYcpgyEEt1UhrJLKQux2gkDtNicQTicFuicYcZd0iawBkjA%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">刻画一个用户或一个实体在某些场景下是否有异常，我们一方面可以分析用户实体的历史行为，对历史基线建模（比如</span>1<span style="font-family:宋体;">个月），如果当前用户实体行为偏离历史一个月的正常行为，那么我们需要关注分析对象是否出现行为偏离历史行为异常。另一方面可以分析用户同类行为，对同类基线建模（比如同组或者同岗位等），如果当前用户实体行为偏离同类行为，那么我们同样需要关注分析对象是否出现了偏离同类基线行为异常。无论是异于自身历史行为或同类行为，都应该引起关注，所以我们需要对每个分析对象建立同类基线及历史基线。</span></span></p><p><span style="font-family:宋体;font-size:12px;">UEBA<span style="font-family:宋体;">通过基于</span><span style="font-family:Calibri;">spark</span><span style="font-family:宋体;">的行为基线建模平台分布式并行的对每一个分析对象（用户或应用等实体）基于历史基线建模和对同类基于群体基线建模。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">单体基线建模：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">如上图所示，基线建模平台会根据场景自动收集历史一段时间日志（例如</span>1<span style="font-family:宋体;">个月），对每个分析对象历史行为建模，刻画用户历史正常行为模式，以用来预测识别当前分析对象的行为是否异常。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">群体基线建模</span>: </span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">如上图所示，基线建模平台会根据场景自动收集分组日志（同组、同部门或同岗位等），对每个分组建立同类基线，客户用户同组正常行为模式，以用来预测识别当前分析对象的行为是否异常。</span></span></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;"><br/></span></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;">2) </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">可解释性</span></strong></p><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">可解释性：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">企业场景下，为了客户快速定位威胁，检测结果必须具有可解释性。即模型既要有规则没有的发现未知的能力同时要像规则一样有较好的可解释性。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于数据及检测场景特点，我们将行为建模算法主要分为两类：时间序列建模和行为分析建模。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">时间序列建模的可解释性</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">：时间序列有天然的可解释性，将时间序列数据及异常点可视化展示即可，如下图示例可见。</span></span></p><p><img class="rich_pages js_insertlocalimg" data-ratio="0.3607305936073059" data-s="300,640" style="text-align: center;width: 188px;height: 68px;" data-type="png" data-w="219" src="https://wechat2rss.xlab.app/img-proxy/?k=8f95c0c7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXm9eu9ibssEia30pcoRLic42PemohzR7jUz4eGc5myHSosLnsIUbmYpvUQA%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.2803347280334728" data-s="300,640" style="text-align: center;width: 187px;height: 52px;" data-type="png" data-w="239" src="https://wechat2rss.xlab.app/img-proxy/?k=1528f397&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmab9eFr1jRwhkqhPIZWIzcOmGhtD3ZuHIktRG5U5IYPASoGNmibzG58g%2F640%3Fwx_fmt%3Dpng"/></p><p>                <span style="font-size: 12px;">离群点                                         拐点</span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">行为分析建模的可解释性：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">我们在行为分析算法后增加</span></span><span style="font-family:Calibri;font-size:12px;">z-score</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">可解释性模块，用来解释模型。</span></span><span style="font-family:Calibri;font-size:12px;">z-score</span><span style="font-family:宋体;font-size:12px;"> <span style="font-family:宋体;">可解释性模块的输出是引起异常最重要的特征集合、特征值及偏离程度，这些指标能很好的解释模型结果。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;"></span><span style="font-family: Calibri;font-size: 14px;font-weight: 700;">3)</span><span style="font-size: 16px;"> </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">时间序列建模</span></strong></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.32265625" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=6d1c56a6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmgcNw4W0ma0aibL0qpyqPeEENIITtkFIXB9E8SwIYcA14cNphUMRbRGA%2F640%3Fwx_fmt%3Dpng"/></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">时间序列建模</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">是将历史数据在时间维度上按先后顺序构建时间序列，并通过一系列相关模型进行建模识别潜在模式，以便对后续数据进行预测或者异常检测。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">根据时间序列本身的特点，我们将时间序列分为</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">周期性的时间序列</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">，和</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">非周期性的时间序列</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">。对不同类型的时间序列应用不同的算法建模。例如：周期性的时间序列应用</span>STL, Holt-Winters<span style="font-family:宋体;">等算法建模；非周期性的时间序列应用小波变换等算法建模。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">根据时间序列异常类型不同，我们将时间序列异常区分为离群点异常，拐点异常，子序列异常。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">时间序列建模加上异常检测可实现</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">离群点检测</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">，</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">拐点检测</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">，</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">异常序列检测</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">等功能。因不同特点的时间序列数据没法在同一个算法上达到最好的效果，所以这里的时间序列算法纳入了不同特点算法以适应不同类型的应用。</span></span></p><p><br/></p><p><span style="text-align: left;font-family: Calibri;font-weight: bold;font-size: 14px;">4) </span><strong style="font-size: 16px;text-align: left;"><span style="font-family: 宋体;font-size: 14px;">行为分析建模</span></strong></p><h3 style="margin-left: 28px;text-align: left;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">行为分析建模主要包括历史行为分析建模和同类行为分析建模两种模式。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">基于历史行为分析建模：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于历史一段时间数据对每个对象建立历史基线，如果企业内部有</span>10W<span style="font-family:宋体;">个用户，那么行为分析建模模块会分布式建立</span><span style="font-family:Calibri;">10W</span><span style="font-family:宋体;">个基线模型，以用来后续对每个用户识别异常行为。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">基于同类行为分析建模：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于同类对象建立同类基线，每个分组建模一个基线模型，例如部门基线，岗位基线等等。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">行为分析建模集成了多种算法例如基于推荐的、基于重构的、基于聚类的、基于半监督、有监督等算法，我们可以根据不同场景选择不同算法来快速完成行为分析建模。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.5171875" data-s="300,640" style="width: 527px;height: 273px;" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=0950f479&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmw91xytlfErmiaMHTzog7AXQodpaXWCngVd5jP4R2KzY8GYZbznRpmMw%2F640%3Fwx_fmt%3Dpng"/></p><h1><strong><span style="font-family: 宋体;font-size: 14pt;"><span style="font-family:宋体;"><br/></span></span></strong></h1><h1><strong><span style="font-family: 宋体;font-size: 14pt;"><span style="font-family:宋体;">三：行为风险评估</span></span></strong></h1><p><strong><span style="font-family: 宋体;font-size: 14pt;"><span style="font-family:宋体;"><br/></span></span></strong></p><h2><strong><span style="font-family: 黑体;font-size: 16px;">1. <span style="font-family:黑体;">自适应风险评估</span></span></strong></h2><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">综合静态画像和动态画像完整的刻画了用户实体，基于画像数据进行</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">行为建模、风险分析、风险评估</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">等等。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">用户风险评估：</span></span></strong></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于用户画像根据不同场景进行风险评估，进而获得用户的登录风险；访问风险；账号权限滥用风险；数据外泄风险；特殊权限操作风险；账号失陷风险；敏感数据访问风险；数据访问异常风险等等。</span></span></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">用户风险评估将通过实时或离线的方式持续对每个用户的风险场景进行异常检测及关联打分，并最终以风险时间线的形式展示，以备后续进行运营调查。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">设备、资产或应用风险评估：</span></span></strong></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于应用、设备、资产或应用画像根据不同情况进行风险评估，例如：设备异地登录风险；大量新增设备风险；应用访问次数激增风险；资产外部告警风险；用户访问资产异常风险等等。</span></span></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">应用、设备、资产或应用风险评估将通过实时或离线方式持续对每个设备或资产的风险异常检测及关联打分，并最终以风险时间线的形式展示，以备后续基于风险评估运营调查。</span></span></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span></p><section style="text-align: left;text-indent: 0em;"><span style="font-family: Calibri;font-weight: bold;font-size: 14px;">1) </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">自适应学习</span></strong></section><section style="text-align: left;text-indent: 0em;"><strong style="text-align: justify;"><span style="font-family: 宋体;font-size: 12px;">为什么需要自适应学习：</span></strong></section><p style="text-align:left;"><strong><span style="font-family: Calibri;font-size: 12px;">a</span></strong><strong><span style="font-family: 宋体;font-size: 12px;">. <span style="font-family:宋体;">风险评估不同客户不同模型：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">风险评估需要适配不同客户环境自适应学习，客户环境是复杂的，不同客户使用不同模型，要求我们需要根据客户真实数据训练模型，不能完全依赖模拟数据。</span></span></p><p><strong><span style="font-family: Calibri;font-size: 12px;">b</span></strong><strong><span style="font-family: 宋体;font-size: 12px;">. <span style="font-family:宋体;">风险评估同一客户不同环境不同模型：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">即使同一客户环境，风险评估也需要根据时间推移自适应学习，</span></span><strong><span style="font-family: 宋体;font-size: 12px;"> </span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">客户环境下的数据并非静态不变而是动态变化的，例如员工权限变化、员工岗位变化、服务器角色的变更、服务器业务增删等等，这些变化都可能引起之前训练的模型失效。所以即使是同一客户环境下，我们也需要动态适配客户环境，根据时间推移自适应学习。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">如何自适应学习：</span></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">自适应学习主要采取训练数据更新、模型自适应更新、动态评价三个步骤来实现：</span></span></p><p><strong><span style="font-family: Calibri;font-size: 12px;">a. </span></strong><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">训练数据更新：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于滑动时间窗口将最近的数据纳入到训练数据中。比如：行为异常检测模型需要</span></span><span style="font-family:Calibri;font-size:12px;">x</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">天数据进行训练，每次训练使用最近的</span></span><span style="font-family:Calibri;font-size:12px;">x</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">天时间窗口的数据。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;">b</span></strong><strong><span style="font-family: Calibri;font-size: 12px;">. </span></strong><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">模型自适应更新：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">时间序列异常检测我们根据任务调度间隔获取</span></span><span style="font-family:Calibri;font-size:12px;">x</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">周最新特征数据做训练同时检测。行为分析异常检测需要根据</span></span><span style="font-family:Calibri;font-size:12px;">x</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">天历史或同类行为数据训练，一般训练时间较长，我们根据反馈数据误报升高时动态更新模型。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;">c</span></strong><strong><span style="font-family: Calibri;font-size: 12px;">. </span></strong><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">动态评价：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">内置场景检测在上线之前我们会对检测能力进行离线评价；然而真实客户环境比较复杂，往往会导致误报增加，如何在不同的客户环境下进行动态评价变得尤为重要。对一部分场景，检测模型会根据测试样例和每次的训练数据动态调整置信度参数控制误报情况。另外提供反馈机制，通过反馈自动学习。</span></span></p><p><span style="text-align: left;text-indent: 0em;font-family: Calibri;font-weight: bold;font-size: 14px;"><br/></span></p><p><span style="text-align: left;text-indent: 0em;font-family: Calibri;font-weight: bold;font-size: 14px;">2) </span><strong style="font-size: 16px;text-align: left;text-indent: 0em;"><span style="font-family: 宋体;font-size: 14px;">在线学习</span></strong></p><h3 style="margin-left: 28px;text-align: left;text-indent: 0em;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">对</span>UEBA<span style="font-family:宋体;">一部分场景需要及时将风险呈现（例如几分钟之内），对于这部分场景风险评估采取在线学习方式，实时预测识别风险。如下图所示针对一部分实时场景，基于</span><span style="font-family:Calibri;">spark streaming</span><span style="font-family:宋体;">在线学习从行为建模中读取实时模型，从画像体系中读取实时画像，在线预测识别风险。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.4909090909090909" data-s="300,640" style="" data-type="png" data-w="1045" src="https://wechat2rss.xlab.app/img-proxy/?k=36c20cb9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmsVXaj7nVZnPgsh7JVVYOADebWEicgEEkAGsibiaibbE7lwcdkYgCgiaGkQA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><br/></p><p style="text-align: left;"><span style="text-align: left;text-indent: 0em;font-family: Calibri;font-weight: bold;font-size: 14px;">3) </span><strong style="font-size: 16px;text-align: left;text-indent: 0em;"><span style="font-family: 宋体;font-size: 14px;">离线学习</span></strong></p><h3 style="margin-left: 28px;text-align: left;text-indent: 0em;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">对</span>UEBA<span style="font-family:宋体;">一部分场景我们需要基于较长时间间隔的画像特征进行建模和预测，比如一天内用户访问行为等，那么我们需要离线建模及预测。如上图所示，基于</span></span><span style="font-family:Calibri;font-size:12px;">S</span><span style="font-family:宋体;font-size:12px;">park<span style="font-family:宋体;">离线学习同样从行为建模中读取离线模型，从画像体系中读取离线画像特征，基于模型及离线数据识别风险。</span></span></p><p><br/></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;">4) </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">集成学习</span></strong></p><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">集成学习可以通过集成多种算法同时对同一个风险场景学习预测，进行风险评估，以达降低误报、预测识别更精准的效果。例如我们可以同时集成单体基线建模和群体基线建模来综合评估用户实体风险。如下图所示：</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.45546875" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=72f56965&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmx24TF2F0cuMzkh0vlYdyYQzDFv47scm9LosuwCSkIVgJBCD0uP69OQ%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><h2><span style="font-family:黑体;font-weight:bold;font-size:16px;">2. </span><strong><span style="font-family: 黑体;font-size: 16px;"><span style="font-family:黑体;">层次动态打分</span></span></strong></h2><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">经过风险评估以后，会识别出每个分析对象的风险场景及置信度。层次动态打分的输入是所有风险场景及置信度及重要性权重，输出是每个用户实体最终的风险分数。风险场景置信度由风险评估直接给出，风险场景的重要性一般是人工经验指定，但是在不同行业不同客户那里，相同的风险场景的重要性却相差较大。风险分的公式如下：</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.0582010582010582" data-s="300,640" style="" data-type="png" data-w="378" src="https://wechat2rss.xlab.app/img-proxy/?k=e13e98e6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmtXNMYuk6vPvW9LJPn2EDeqfMficUpWNEK8mUcW2uPIia1tNic5ABNFKyQ%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">，其中</span>risks<span style="font-family:宋体;">指风险评估检测识别出的用户实体相关场景的风险集合，</span><span style="font-family:Calibri;">confiden</span></span><span style="font-family:宋体;font-size:12px;">ce</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">指风险置信度，</span>severity<span style="font-family:宋体;">指风险严重程度，</span><span style="font-family:Calibri;">context</span><span style="font-family:宋体;">指风险发生的上下文包括时间、前后关系等等，</span><span style="font-family:Calibri;">context</span><span style="font-family:宋体;">主要通过影响</span><span style="font-family:Calibri;">severity</span><span style="font-family:宋体;">来影响</span><span style="font-family:Calibri;">score</span><span style="font-family:宋体;">。所以严重程度的权重对打分有很重要的</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">作用</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">御见</span>UEBA<span style="font-family:宋体;">采用层次动态打分的机制，前期主要基于推荐及策略将人工经验融入其中进行风险权重调整再计算出风险总分。后期用户有了长期反馈以后，启动基于强化学习动态打分模型，自动调整风险场景权重及用户实体风险总分。</span></span></p><p><br/></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;">1) </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">基于推荐及策略的风险权重调整</span></strong></p><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">基于策略的风险权重调整：</span></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">我们融入多种人工经验到策略中自动调整风险权重，例如：时间衰减；相同风险频繁出现动态降低权重；风险上下文命中自动增加权重等等。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">基于推荐的风险权重调整</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">：</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.2783882783882784" data-s="300,640" style="" data-type="png" data-w="546" src="https://wechat2rss.xlab.app/img-proxy/?k=5b3dac18&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmb1PaMMatogfBfox2QVVAl1KfaTmFRLa1nQ1hd3XrKKRnibQG2u6eNaQ%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">针对有些特定场景我们可以通过推荐的算法自动预测风险事件权重，例如：首次访问敏感数据风险；</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于推荐算法的主要思路是将用户和同类的历史访问行为及用户上下文信息考虑进去，利用推荐算法</span></span><span style="font-size:12px;">FM</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">预测用户访问每个实体的概率</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">。我们将这个概率作为首次访问敏感数据风险场景的重要性权重。</span></span></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;"><br/></span></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;">2) </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">基于强化学习动态打分模型</span></strong></p><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><span style="font-family:宋体;font-size:12px;">UEBA<span style="font-family:宋体;">部署前期阶段有较少的反馈，所以我们主要通过推荐及策略的方式调整重要性权重进行打分。当后期随着运营人员不断的反馈，前期产生的权重将作为初始参数与反馈的结果一同进入到基于强化学习的动态打分模型中，模型通过持续的奖赏和惩罚，动态调整权重及风险分数。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.551980198019802" data-s="300,640" style="" data-type="png" data-w="808" src="https://wechat2rss.xlab.app/img-proxy/?k=482dc7b6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmlJWgricwoSrxo4Ca5WIsvf5eqIAmgxjMG9fOz2I4UMz4BibvASa9kJjg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><h1><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;">四</span></span></strong><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;">：</span></span></strong><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;">总结</span></span></strong></h1><p><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;"><br/></span></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">腾讯御见</span>UEBA<span style="font-family:宋体;">主要围绕</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">智能检测分析平台</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">构建了支撑</span>UEBA<span style="font-family:宋体;">的</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">关联检测分析能力，智能检测分析平台首先关联多源日志构建画像体系，然后基于完备的画像体系进行行为建模，通过行为建模对用户实体进行行为风险评估，最终将所有用户实体风险事件送入层次动态打分机制，完成用户实体的最终风险评分。</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">本文分别对</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">画像体系，行为建模，自适应风险评估，层次动态打分</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">进行了简单介绍，有兴趣欢迎交流。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"></span></span><br/></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span><br/></p><h3 style="margin-left:28px;"><br/></h3><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><br/></p>



<p><a href="2247484176">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=a4d83f91&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484176%26idx%3D1%26sn%3D618cea754b370200440b0645754dddc7%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Tue, 28 Jul 2020 12:00:00 +0800</pubDate>
    </item>
    <item>
      <title>腾讯御见UEBA背后的技术</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484165&amp;idx=1&amp;sn=3ab7548e39de360b7e8f012ecce3f249</link>
      <description>目前我们御见UEBA产品最新版本已经发布，上一篇文章我们结合最新版本对御见UEBA产品进行了简单介绍，本文将对腾讯御见UEBA相关技术进行介绍，有兴趣欢迎交流。</description>
      <content:encoded><![CDATA[<p>
<span>御见UEBA团队</span> <span>2020-07-27 12:00</span> <span style="display: inline-block;"></span>
</p>

<p>目前我们御见UEBA产品最新版本已经发布，上一篇文章我们结合最新版本对御见UEBA产品进行了简单介绍，本文将对腾讯御见UEBA相关技术进行介绍，有兴趣欢迎交流。</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=ac2d455a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmKfWSgichUnBbicHNYGQyZTIWzibmmawRgEkmiafjnUErz5xibghZz1VfbRw%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p style="text-align:left;"><span style="font-family: 宋体;font-size: 12px;"> <strong>引子：</strong></span><span style="font-size: 14px;font-family: 宋体;"></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">腾讯御见</span>UEBA<span style="font-family:宋体;">（用户实体行为分析）面向政企办公安全、数据安全治理、员工行为管理，使用一系列分析方法（统计学习、机器学习等</span></span><strong><span style="font-size: 12px;font-family: 宋体;">高级分析方法</span></strong><span style="font-size: 12px;font-family: 宋体;">）通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建</span><strong><span style="font-size: 12px;font-family: 宋体;">用户实体画像</span></strong><span style="font-size: 12px;font-family: 宋体;">（静态画像、动态画像），然后基于用户实体画像进行</span><strong><span style="font-size: 12px;font-family: 宋体;">风险检测、风险分析、风险评估，</span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">最终识别内部风险用户和风险实体。御见</span>UEBA<span style="font-family:宋体;">是单独的解决方案或产品，也可以作为一种高级分析能力或模块嵌入到御见</span><span style="font-family:Calibri;">SOC</span><span style="font-family:宋体;">中。目前我们御见</span><span style="font-family:Calibri;">UEBA</span><span style="font-family:宋体;">产品最新版本已经发布，上一篇文章我们结合<strong>最新版本</strong>对御见</span><span style="font-family:Calibri;">UEBA</span><span style="font-family:宋体;">产品进行了简单介绍，本文将对腾讯御见</span><span style="font-family:Calibri;">UEBA</span><strong><span style="font-family:宋体;">相关技术</span></strong><span style="font-family:宋体;">进行介绍，有兴趣欢迎交流。</span></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.6609029779058597" data-s="300,640" style="" data-type="png" data-w="1041" src="https://wechat2rss.xlab.app/img-proxy/?k=02411f82&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmSwqDgBcPd1n26gJTzZRZhwiajgSYJbj9rdXW1jHLWI7L68EiaHoD4DKQ%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><h1><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;">一：御见</span>UEBA<span style="font-family:宋体;">技术架构</span></span></strong></h1><p><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;"><br/></span></span></strong></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">御见</span>UEBA<span style="font-family:宋体;">技术架构</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">如下图所示，主要包括</span>3<span style="font-family:宋体;">个部分：数据采集，智能检测分析平台，行为风险评估。</span><span style="font-family:Calibri;">UEBA</span><span style="font-family:宋体;">采集多源数据例如登录日志，访问日志，其他安全产品日志，流量数据等，并对多源日志进行关联、分析、检测，基于行为分析等多种方法识别政企内部的用户风险和业务风险。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.5" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=0c6061f9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmLzjYnqic2VruiahSQ5MKHS5ll53pwicWWIKwhyGiateytSMEjpVORaiaDxA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p><strong><span style="font-family: 宋体;font-size: 14px;">1. <span style="font-family:宋体;">数据采集</span></span></strong></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;">UEBA<span style="font-family:宋体;">采集的数据源主要有三类：登录日志；访问日志；其他日志。</span></span></p><p style="text-indent:28px;"><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">登录日志：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">主要记录用户认证登录业务、系统或应用的行为日志。例如：</span>IAM<span style="font-family:宋体;">统一认证登录日志，</span><span style="font-family:Calibri;">IOA</span><span style="font-family:宋体;">登录认证日志，</span><span style="font-family:Calibri;">VPN</span><span style="font-family:宋体;">日志，核心业务登录日志，</span><span style="font-family:Calibri;">AD</span><span style="font-family:宋体;">日志，</span><span style="font-family:Calibri;">LDAP</span><span style="font-family:宋体;">日志等等；</span></span></p><p style="text-indent:28px;"><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">访问日志：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">主要记录用户认证登录成功后访问业务、系统或应用产生的行为日志。例如：里约网关访问日志，</span>IOA<span style="font-family:宋体;">应用访问日志，堡垒机日志，数据库审计日志，门禁日志，其他核心业务访问日志等等；</span></span></p><p style="text-indent:28px;"><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">其他日志：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">主要包括其他安全产品日志，流量日志。例如：</span>DLP<span style="font-family:宋体;">日志，</span><span style="font-family:Calibri;">IOA</span><span style="font-family:宋体;">日志，威胁情报，</span><span style="font-family:Calibri;">flow</span><span style="font-family:宋体;">数据，其他安全产品日志等等。</span></span></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span></p><p><strong><span style="font-family: 宋体;font-size: 14px;">2. <span style="font-family:宋体;">智能检测分析平台</span></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">智能检测分析平台为</span>UEBA<span style="font-family:宋体;">提供了主要的关联检测分析能力，一方面智能检测模块在产品上以可配置的基线建模平台的形式提供了画像体系构建、行为建模能力；另一方面智能分析模块根据场景进行风险检测、风险评估，并且基于风险评估结果进行动态打分，最终用户实体将以风险分数排序的方式展示给运营人员。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">智能检测和智能分析将通过自适应学习、在线学习、离线学习、集成学习、强化学习等方式学习预测。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span></p><p><strong><span style="font-family: 宋体;font-size: 14px;">3. <span style="font-family:宋体;">行为风险评估</span></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">行为风险评估主要包括根据特定场景风险评估和用户实体综合风险打分。特定场景风险主要对用户进行恶意用户分析、失陷用户分析、违规用户分析、离职员工风险分析，对业务进行业务滥用分析、数据泄露分析、业务异常分析、业务运行状态监控等分析，最后综合所有的特定场景风险以用户实体的维度综合风险评分。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span></p><h1><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;">二：智能检测分析平台</span> </span></strong></h1><p><strong><span style="font-family: 宋体;font-size: 19px;"><br/></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">智能检测分析平台为</span>UEBA<span style="font-family:宋体;">提供了主要的关联检测分析能力，智能检测分析平台主要包括</span><span style="font-family:Calibri;">4</span><span style="font-family:宋体;">大部分：画像体系，行为建模，自适应风险评估，层次动态打分。智能检测分析平台首先关联多源日志构建画像体系，然后基于完备的画像体系进行行为建模，通过行为建模对用户实体进行行为风险评估，最终将所有用户实体风险事件送入层次动态打分机制，完成用户实体的最终风险评分。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.472168905950096" data-s="300,640" style="" data-type="png" data-w="521" src="https://wechat2rss.xlab.app/img-proxy/?k=06a6c140&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmaJAPOqtLmj026ZS2qibmt5W6z9dekBy9vVZiaI7MniaWfg2qATxul37ZA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><h2><strong><span style="font-family: 黑体;font-size: 16px;">1. <span style="font-family:黑体;">画像体系</span></span></strong></h2><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">御见</span>UEBA<span style="font-family:宋体;">分析的对象主要包括用户、设备、资产、应用等等，当多源日志接入以后会自动构建用户实体画像体系，持续丰富更新用户实体的</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">静态画像和动态画像</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">用户实体静态画像：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">及时更新维护用户实体的静态信息，例如：用户身份、部门、岗位、权限、账号；设备归属；资产身份及重要性；应用敏感度等等。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">用户实体动态画像：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">持续监控用户实体行为建立动态画像。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于S</span>park<span style="font-family:宋体;">计算引擎</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">实时监控</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">用户实体的行为统计提取行为特征，并通过</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">机器学习算法</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于分析对象行为特征建立历史基线画像、同类画像及动态分组；分析对象的行为不是静态不变而是随着时间动态变化的，统计画像、历史基线画像和同类画像就构成了分析对象的动态画像，用来刻画分析对象的动态个性。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">动态画像例如：用户访问敏感数据的历史频次等等；用户当天访问某个资产的时间，地点，操作行为等等；资产与其他资产通信情况或用户访问资产情况等等；设备当前登录次数，使用状态等等。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.9192546583850931" data-s="300,640" style="" data-type="png" data-w="322" src="https://wechat2rss.xlab.app/img-proxy/?k=0627ef1f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmvBhhOTdibAczcHUNzk5tDGFC2dWSSrwyZIazjDr9BekMqU2Z0actrRA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><h2><strong><span style="font-family: 黑体;font-size: 16px;">2. <span style="font-family:黑体;">行为建模</span></span></strong></h2><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">画像体系构建，一方面实时更新一方面送入行为建模。因为接入海量的多源日志数据并且对每个用户和实体进行实时监控，单机有性能瓶颈问题所以我们基于大数据计算引擎</span>Spark<span style="font-family:宋体;">搭建了行为基线建模平台（可配置的基线建模平台），并且支持</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">简单拖拽（不用编写代码）</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">即可快速完成行为建模调试及生成环境上线。可配置的基线建模平台数据流图如下图所示，</span>Spark<span style="font-family:宋体;">读取多源数据，经过预处理、数据转换、特征提取、</span><span style="font-family:Calibri;">AI</span><span style="font-family:宋体;">引擎、可解释性模块、决策引擎，完成整个行为基线建模流程。下面将通过基线建模、可解释性、时间序列、行为分析等方面介绍。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.5247706422018349" data-s="300,640" style="" data-type="png" data-w="545" src="https://wechat2rss.xlab.app/img-proxy/?k=e0c748a6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXm1ajXp4knb14ZC5NVN8XEZbLJAMiaeCDibb4Eic17oPTe5OggImyGkrfDg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="text-align: justify;font-family: Calibri;font-weight: bold;font-size: 14px;">1) </span><strong style="font-size: 16px;text-align: justify;"><span style="font-family: 宋体;font-size: 14px;">分布式单体基线建模/群体基线建模</span></strong></p><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.4722222222222222" data-s="300,640" style="" data-type="png" data-w="540" src="https://wechat2rss.xlab.app/img-proxy/?k=1e42f683&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmh2eDX8Zl8YLV1biaBuB2HicGLnNmEC9qgS6kRlMibJ3mSWg1Yiapc5XoMA%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">刻画一个用户或一个实体在某些场景下是否有异常，我们一方面可以分析用户实体的历史行为，对历史基线建模（比如</span>1<span style="font-family:宋体;">个月），如果当前用户实体行为偏离历史一个月的正常行为，那么我们需要关注分析对象是否出现行为偏离历史行为异常。另一方面可以分析用户同类行为，对同类基线建模（比如同组或者同岗位等），如果当前用户实体行为偏离同类行为，那么我们同样需要关注分析对象是否出现了偏离同类基线行为异常。无论是异于自身历史行为或同类行为，都应该引起关注，所以我们需要对每个分析对象建立同类基线及历史基线。</span></span></p><p><span style="font-family:宋体;font-size:12px;">UEBA<span style="font-family:宋体;">通过基于</span><span style="font-family:Calibri;">spark</span><span style="font-family:宋体;">的行为基线建模平台分布式并行的对每一个分析对象（用户或应用等实体）基于历史基线建模和对同类基于群体基线建模。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">单体基线建模：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">如上图所示，基线建模平台会根据场景自动收集历史一段时间日志（例如</span>1<span style="font-family:宋体;">个月），对每个分析对象历史行为建模，刻画用户历史正常行为模式，以用来预测识别当前分析对象的行为是否异常。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">群体基线建模</span>: </span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">如上图所示，基线建模平台会根据场景自动收集分组日志（同组、同部门或同岗位等），对每个分组建立同类基线，客户用户同组正常行为模式，以用来预测识别当前分析对象的行为是否异常。</span></span></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;"><br/></span></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;">2) </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">可解释性</span></strong></p><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">可解释性：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">企业场景下，为了客户快速定位威胁，检测结果必须具有可解释性。即模型既要有规则没有的发现未知的能力同时要像规则一样有较好的可解释性。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于数据及检测场景特点，我们将行为建模算法主要分为两类：时间序列建模和行为分析建模。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">时间序列建模的可解释性</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">：时间序列有天然的可解释性，将时间序列数据及异常点可视化展示即可，如下图示例可见。</span></span></p><p><img class="rich_pages js_insertlocalimg" data-ratio="0.3607305936073059" data-s="300,640" style="text-align: center;width: 188px;height: 68px;" data-type="png" data-w="219" src="https://wechat2rss.xlab.app/img-proxy/?k=8f95c0c7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXm9eu9ibssEia30pcoRLic42PemohzR7jUz4eGc5myHSosLnsIUbmYpvUQA%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.2803347280334728" data-s="300,640" style="text-align: center;width: 187px;height: 52px;" data-type="png" data-w="239" src="https://wechat2rss.xlab.app/img-proxy/?k=1528f397&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmab9eFr1jRwhkqhPIZWIzcOmGhtD3ZuHIktRG5U5IYPASoGNmibzG58g%2F640%3Fwx_fmt%3Dpng"/></p><p>                <span style="font-size: 12px;">离群点                                         拐点</span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">行为分析建模的可解释性：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">我们在行为分析算法后增加</span></span><span style="font-family:Calibri;font-size:12px;">z-score</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">可解释性模块，用来解释模型。</span></span><span style="font-family:Calibri;font-size:12px;">z-score</span><span style="font-family:宋体;font-size:12px;"> <span style="font-family:宋体;">可解释性模块的输出是引起异常最重要的特征集合、特征值及偏离程度，这些指标能很好的解释模型结果。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;"></span><span style="font-family: Calibri;font-size: 14px;font-weight: 700;">3)</span><span style="font-size: 16px;"> </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">时间序列建模</span></strong></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.3232931726907631" data-s="300,640" style="" data-type="png" data-w="498" src="https://wechat2rss.xlab.app/img-proxy/?k=b807023e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmESDsJ1sxQFA5Awdc0hWIiamvicicwfaVlp1dcqDnLjicQonPjsUy36scwg%2F640%3Fwx_fmt%3Dpng"/></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">时间序列建模</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">是将历史数据在时间维度上按先后顺序构建时间序列，并通过一系列相关模型进行建模识别潜在模式，以便对后续数据进行预测或者异常检测。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">根据时间序列本身的特点，我们将时间序列分为</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">周期性的时间序列</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">，和</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">非周期性的时间序列</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">。对不同类型的时间序列应用不同的算法建模。例如：周期性的时间序列应用</span>STL, Holt-Winters<span style="font-family:宋体;">等算法建模；非周期性的时间序列应用小波变换等算法建模。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">根据时间序列异常类型不同，我们将时间序列异常区分为离群点异常，拐点异常，子序列异常。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">时间序列建模加上异常检测可实现</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">离群点检测</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">，</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">拐点检测</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">，</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">异常序列检测</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">等功能。因不同特点的时间序列数据没法在同一个算法上达到最好的效果，所以这里的时间序列算法纳入了不同特点算法以适应不同类型的应用。</span></span></p><p><br/></p><p><span style="text-align: left;font-family: Calibri;font-weight: bold;font-size: 14px;">4) </span><strong style="font-size: 16px;text-align: left;"><span style="font-family: 宋体;font-size: 14px;">行为分析建模</span></strong></p><h3 style="margin-left: 28px;text-align: left;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">行为分析建模主要包括历史行为分析建模和同类行为分析建模两种模式。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">基于历史行为分析建模：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于历史一段时间数据对每个对象建立历史基线，如果企业内部有</span>10W<span style="font-family:宋体;">个用户，那么行为分析建模模块会分布式建立</span><span style="font-family:Calibri;">10W</span><span style="font-family:宋体;">个基线模型，以用来后续对每个用户识别异常行为。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">基于同类行为分析建模：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于同类对象建立同类基线，每个分组建模一个基线模型，例如部门基线，岗位基线等等。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">行为分析建模集成了多种算法例如基于推荐的、基于重构的、基于聚类的、基于半监督、有监督等算法，我们可以根据不同场景选择不同算法来快速完成行为分析建模。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.5178571428571429" data-s="300,640" style="" data-type="png" data-w="504" src="https://wechat2rss.xlab.app/img-proxy/?k=1e7a3478&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmHYciaJvYdGh6SeWFV0NicY75sdfAXicBicmv63OAJUWuiabKShQwia98c7ug%2F640%3Fwx_fmt%3Dpng"/></p><h1><strong><span style="font-family: 宋体;font-size: 14pt;"><span style="font-family:宋体;"><br/></span></span></strong></h1><h1><strong><span style="font-family: 宋体;font-size: 14pt;"><span style="font-family:宋体;">三：行为风险评估</span></span></strong></h1><p><strong><span style="font-family: 宋体;font-size: 14pt;"><span style="font-family:宋体;"><br/></span></span></strong></p><h2><strong><span style="font-family: 黑体;font-size: 16px;">1. <span style="font-family:黑体;">自适应风险评估</span></span></strong></h2><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">综合静态画像和动态画像完整的刻画了用户实体，基于画像数据进行</span></span><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">行为建模、风险分析、风险评估</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">等等。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">用户风险评估：</span></span></strong></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于用户画像根据不同场景进行风险评估，进而获得用户的登录风险；访问风险；账号权限滥用风险；数据外泄风险；特殊权限操作风险；账号失陷风险；敏感数据访问风险；数据访问异常风险等等。</span></span></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">用户风险评估将通过实时或离线的方式持续对每个用户的风险场景进行异常检测及关联打分，并最终以风险时间线的形式展示，以备后续进行运营调查。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">设备、资产或应用风险评估：</span></span></strong></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于应用、设备、资产或应用画像根据不同情况进行风险评估，例如：设备异地登录风险；大量新增设备风险；应用访问次数激增风险；资产外部告警风险；用户访问资产异常风险等等。</span></span></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">应用、设备、资产或应用风险评估将通过实时或离线方式持续对每个设备或资产的风险异常检测及关联打分，并最终以风险时间线的形式展示，以备后续基于风险评估运营调查。</span></span></p><p style="text-indent:28px;"><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span></p><section style="text-align: left;text-indent: 0em;"><span style="font-family: Calibri;font-weight: bold;font-size: 14px;">1) </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">自适应学习</span></strong></section><section style="text-align: left;text-indent: 0em;"><strong style="text-align: justify;"><span style="font-family: 宋体;font-size: 12px;">为什么需要自适应学习：</span></strong></section><p style="text-align:left;"><strong><span style="font-family: Calibri;font-size: 12px;">a</span></strong><strong><span style="font-family: 宋体;font-size: 12px;">. <span style="font-family:宋体;">风险评估不同客户不同模型：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">风险评估需要适配不同客户环境自适应学习，客户环境是复杂的，不同客户使用不同模型，要求我们需要根据客户真实数据训练模型，不能完全依赖模拟数据。</span></span></p><p><strong><span style="font-family: Calibri;font-size: 12px;">b</span></strong><strong><span style="font-family: 宋体;font-size: 12px;">. <span style="font-family:宋体;">风险评估同一客户不同环境不同模型：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">即使同一客户环境，风险评估也需要根据时间推移自适应学习，</span></span><strong><span style="font-family: 宋体;font-size: 12px;"> </span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">客户环境下的数据并非静态不变而是动态变化的，例如员工权限变化、员工岗位变化、服务器角色的变更、服务器业务增删等等，这些变化都可能引起之前训练的模型失效。所以即使是同一客户环境下，我们也需要动态适配客户环境，根据时间推移自适应学习。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">如何自适应学习：</span></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">自适应学习主要采取训练数据更新、模型自适应更新、动态评价三个步骤来实现：</span></span></p><p><strong><span style="font-family: Calibri;font-size: 12px;">a. </span></strong><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">训练数据更新：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于滑动时间窗口将最近的数据纳入到训练数据中。比如：行为异常检测模型需要</span></span><span style="font-family:Calibri;font-size:12px;">x</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">天数据进行训练，每次训练使用最近的</span></span><span style="font-family:Calibri;font-size:12px;">x</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">天时间窗口的数据。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;">b</span></strong><strong><span style="font-family: Calibri;font-size: 12px;">. </span></strong><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">模型自适应更新：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">时间序列异常检测我们根据任务调度间隔获取</span></span><span style="font-family:Calibri;font-size:12px;">x</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">周最新特征数据做训练同时检测。行为分析异常检测需要根据</span></span><span style="font-family:Calibri;font-size:12px;">x</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">天历史或同类行为数据训练，一般训练时间较长，我们根据反馈数据误报升高时动态更新模型。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;">c</span></strong><strong><span style="font-family: Calibri;font-size: 12px;">. </span></strong><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">动态评价：</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">内置场景检测在上线之前我们会对检测能力进行离线评价；然而真实客户环境比较复杂，往往会导致误报增加，如何在不同的客户环境下进行动态评价变得尤为重要。对一部分场景，检测模型会根据测试样例和每次的训练数据动态调整置信度参数控制误报情况。另外提供反馈机制，通过反馈自动学习。</span></span></p><p><span style="text-align: left;text-indent: 0em;font-family: Calibri;font-weight: bold;font-size: 14px;"><br/></span></p><p><span style="text-align: left;text-indent: 0em;font-family: Calibri;font-weight: bold;font-size: 14px;">2) </span><strong style="font-size: 16px;text-align: left;text-indent: 0em;"><span style="font-family: 宋体;font-size: 14px;">在线学习</span></strong></p><h3 style="margin-left: 28px;text-align: left;text-indent: 0em;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">对</span>UEBA<span style="font-family:宋体;">一部分场景需要及时将风险呈现（例如几分钟之内），对于这部分场景风险评估采取在线学习方式，实时预测识别风险。如下图所示针对一部分实时场景，基于</span><span style="font-family:Calibri;">spark streaming</span><span style="font-family:宋体;">在线学习从行为建模中读取实时模型，从画像体系中读取实时画像，在线预测识别风险。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.4909456740442656" data-s="300,640" style="" data-type="png" data-w="497" src="https://wechat2rss.xlab.app/img-proxy/?k=9f3c1b13&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmNBGRpSDG4YJShf6CxRL7SZXMEbJMicvGvn1GKK7kAUQ8P1sUwmosS3w%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><br/></p><p style="text-align: left;"><span style="text-align: left;text-indent: 0em;font-family: Calibri;font-weight: bold;font-size: 14px;">3) </span><strong style="font-size: 16px;text-align: left;text-indent: 0em;"><span style="font-family: 宋体;font-size: 14px;">离线学习</span></strong></p><h3 style="margin-left: 28px;text-align: left;text-indent: 0em;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">对</span>UEBA<span style="font-family:宋体;">一部分场景我们需要基于较长时间间隔的画像特征进行建模和预测，比如一天内用户访问行为等，那么我们需要离线建模及预测。如上图所示，基于</span></span><span style="font-family:Calibri;font-size:12px;">S</span><span style="font-family:宋体;font-size:12px;">park<span style="font-family:宋体;">离线学习同样从行为建模中读取离线模型，从画像体系中读取离线画像特征，基于模型及离线数据识别风险。</span></span></p><p><br/></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;">4) </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">集成学习</span></strong></p><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">集成学习可以通过集成多种算法同时对同一个风险场景学习预测，进行风险评估，以达降低误报、预测识别更精准的效果。例如我们可以同时集成单体基线建模和群体基线建模来综合评估用户实体风险。如下图所示：</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.45579567779960706" data-s="300,640" style="" data-type="png" data-w="509" src="https://wechat2rss.xlab.app/img-proxy/?k=0855f4da&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmJx8vSv1a96lJaibaqQGPSicyHRVmTXGexia44uDrlRuReMvVrMSGHtriaQ%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><h2><span style="font-family:黑体;font-weight:bold;font-size:16px;">2. </span><strong><span style="font-family: 黑体;font-size: 16px;"><span style="font-family:黑体;">层次动态打分</span></span></strong></h2><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">经过风险评估以后，会识别出每个分析对象的风险场景及置信度。层次动态打分的输入是所有风险场景及置信度及重要性权重，输出是每个用户实体最终的风险分数。风险场景置信度由风险评估直接给出，风险场景的重要性一般是人工经验指定，但是在不同行业不同客户那里，相同的风险场景的重要性却相差较大。风险分的公式如下：</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.0582010582010582" data-s="300,640" style="" data-type="png" data-w="378" src="https://wechat2rss.xlab.app/img-proxy/?k=e13e98e6&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmtXNMYuk6vPvW9LJPn2EDeqfMficUpWNEK8mUcW2uPIia1tNic5ABNFKyQ%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">，其中</span>risks<span style="font-family:宋体;">指风险评估检测识别出的用户实体相关场景的风险集合，</span><span style="font-family:Calibri;">confiden</span></span><span style="font-family:宋体;font-size:12px;">ce</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">指风险置信度，</span>severity<span style="font-family:宋体;">指风险严重程度，</span><span style="font-family:Calibri;">context</span><span style="font-family:宋体;">指风险发生的上下文包括时间、前后关系等等，</span><span style="font-family:Calibri;">context</span><span style="font-family:宋体;">主要通过影响</span><span style="font-family:Calibri;">severity</span><span style="font-family:宋体;">来影响</span><span style="font-family:Calibri;">score</span><span style="font-family:宋体;">。所以严重程度的权重对打分有很重要的</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">作用</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">御见</span>UEBA<span style="font-family:宋体;">采用层次动态打分的机制，前期主要基于推荐及策略将人工经验融入其中进行风险权重调整再计算出风险总分。后期用户有了长期反馈以后，启动基于强化学习动态打分模型，自动调整风险场景权重及用户实体风险总分。</span></span></p><p><br/></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;">1) </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">基于推荐及策略的风险权重调整</span></strong></p><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">基于策略的风险权重调整：</span></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">我们融入多种人工经验到策略中自动调整风险权重，例如：时间衰减；相同风险频繁出现动态降低权重；风险上下文命中自动增加权重等等。</span></span></p><p><strong><span style="font-family: 宋体;font-size: 12px;"><span style="font-family:宋体;">基于推荐的风险权重调整</span></span></strong><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">：</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.2783882783882784" data-s="300,640" style="" data-type="png" data-w="546" src="https://wechat2rss.xlab.app/img-proxy/?k=5b3dac18&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmb1PaMMatogfBfox2QVVAl1KfaTmFRLa1nQ1hd3XrKKRnibQG2u6eNaQ%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">针对有些特定场景我们可以通过推荐的算法自动预测风险事件权重，例如：首次访问敏感数据风险；</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">基于推荐算法的主要思路是将用户和同类的历史访问行为及用户上下文信息考虑进去，利用推荐算法</span></span><span style="font-size:12px;">FM</span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">预测用户访问每个实体的概率</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">。我们将这个概率作为首次访问敏感数据风险场景的重要性权重。</span></span></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;"><br/></span></p><p><span style="font-family: Calibri;font-weight: bold;font-size: 14px;">2) </span><strong style="font-size: 16px;"><span style="font-family: 宋体;font-size: 14px;">基于强化学习动态打分模型</span></strong></p><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><span style="font-family:宋体;font-size:12px;">UEBA<span style="font-family:宋体;">部署前期阶段有较少的反馈，所以我们主要通过推荐及策略的方式调整重要性权重进行打分。当后期随着运营人员不断的反馈，前期产生的权重将作为初始参数与反馈的结果一同进入到基于强化学习的动态打分模型中，模型通过持续的奖赏和惩罚，动态调整权重及风险分数。</span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.6616541353383458" data-s="300,640" style="" data-type="png" data-w="399" src="https://wechat2rss.xlab.app/img-proxy/?k=e8640be1&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQUoTWUhzibZqzuZytQSrDXmN8TRmQy2LbHU3KrSRXR3ChjHUPkoH8eNibvTH92Ths0XbkibhSp12xZg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><h1><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;">四</span></span></strong><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;">：</span></span></strong><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;">总结</span></span></strong></h1><p><strong><span style="font-family: 宋体;font-size: 19px;"><span style="font-family:宋体;"><br/></span></span></strong></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">腾讯御见</span>UEBA<span style="font-family:宋体;">主要围绕</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">智能检测分析平台</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">构建了支撑</span>UEBA<span style="font-family:宋体;">的</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">关联检测分析能力，智能检测分析平台首先关联多源日志构建画像体系，然后基于完备的画像体系进行行为建模，通过行为建模对用户实体进行行为风险评估，最终将所有用户实体风险事件送入层次动态打分机制，完成用户实体的最终风险评分。</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">本文分别对</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">画像体系，行为建模，自适应风险评估，层次动态打分</span></span><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;">进行了简单介绍，有兴趣欢迎交流。</span></span></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"></span></span><br/></p><p><span style="font-family:宋体;font-size:12px;"><span style="font-family:宋体;"><br/></span></span><br/></p><h3 style="margin-left:28px;"><br/></h3><h3 style="margin-left:28px;"><strong><span style="font-family: 宋体;font-size: 14px;"><span style="font-family:宋体;"></span></span></strong></h3><p><br/></p>



<p><a href="2247484165">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=9a004cf2&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484165%26idx%3D1%26sn%3D3ab7548e39de360b7e8f012ecce3f249%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 27 Jul 2020 12:00:00 +0800</pubDate>
    </item>
    <item>
      <title>腾讯御见UEBA</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484137&amp;idx=1&amp;sn=b76de04805ec6a87e77430201dc4948f</link>
      <description>腾讯御见UEBA面向政企办公安全、数据安全治理、员工行为管理，使用一系列分析方法通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建用户实体画像，然后基于用户实体画像进行风险检测、风险分析、风险评估，最终识别内部风险用户和风险实体。</description>
      <content:encoded><![CDATA[<p>
原创 <span>御见UEBA团队</span> <span>2020-07-14 12:00</span> <span style="display: inline-block;"></span>
</p>

<p>腾讯御见UEBA面向政企办公安全、数据安全治理、员工行为管理，使用一系列分析方法通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建用户实体画像，然后基于用户实体画像进行风险检测、风险分析、风险评估，最终识别内部风险用户和风险实体。</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=5b438e5e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6iclRKVs4HWaFObnsPqftGVQquC0p3jkr1WCjkoowhZwtLd6x3icHo3Jyg%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p style="text-align: left;"><strong><span style="font-size: 16px;font-family: 宋体;">引子：</span></strong><span style="font-size: 16px;"><span style="font-family: 宋体;"><span style="font-family: 宋体;">腾讯御见</span>UEBA<span style="font-family: 宋体;">（用户实体行为分析）面向政企办公安全、数据安全治理、员工行为管理，使用一系列分析方法（统计学习、机器学习等</span></span><strong><span style="font-family: 宋体;">高级分析方法</span></strong><span style="font-family: 宋体;">）通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建</span><strong><span style="font-family: 宋体;">用户实体画像</span></strong><span style="font-family: 宋体;">（静态画像、动态画像），然后基于用户实体画像进行</span><strong><span style="font-family: 宋体;">风险检测、风险分析、风险评估，</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">最终识别内部风险用户和风险实体。御见</span>UEBA<span style="font-family: 宋体;">是单独的解决方案或产品，也可以作为一种高级分析能力或模块嵌入到御见</span>SOC<span style="font-family: 宋体;">中。目前我们御见</span><span style="font-family: Calibri;">UEBA</span><span style="font-family: 宋体;">产品最新版本已经发布，本文会结合最新版本对御见</span><span style="font-family: Calibri;">UEBA</span><span style="font-family: 宋体;">进行简单介绍。</span></span></span></p><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.2720970537261698" data-s="300,640" style="" data-type="png" data-w="577" src="https://wechat2rss.xlab.app/img-proxy/?k=cc062fe8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icPuRnXiag2UnhkXtNApJ5TjuYXGkicuKnBBoaQhV2pJEicg3zldoFCIPuQ%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: justify;margin: 0pt;text-indent: 0pt;padding: 0pt;"><span style="font-size: 16px;"><br/></span></p><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-family: 宋体;">一、背景</span></strong></span><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"></span></strong></span></h1><p><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;font-size: 16px;">2019 verizon数据泄露调查报告指出，<span style="font-family: Calibri;">34%</span>的数据泄露涉及企业内部人员。内部人员对企业构成了特殊的威胁，传统安全产品无法检测，因为他们有权限访问内部系统，通常能够绕过安全措施，从而给安全团队造成安全盲点。大多数网络安全专家都认为，企业网络安全系统中最薄弱的环节是其员工。据网络安全咨询公司<span style="font-family: Calibri;">CrowdStrike</span>研究发现，百分之五到百分之十的员工会点击钓鱼邮件，点击钓鱼邮件受害者的计算机将自动运行恶意程序并被完全控制，攻击者进而通过合法的身份账号做数据窃取等不法操作而不被发现。内部威胁，内部人员风险对企业安全尤其重要。</span></p><p style="text-align: left;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">攻击变得越来越复杂，传统安全解决方案大多基于规则的单点检测，往往检测不到或发现更多未知威胁。针对越来越复杂的攻击，需要打破单点检测引入行为分析等高级分析方法。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">在SANS研究所最近的一项调查中，受访者确定了安全组织的三大优先事项：更好的调查功能，更多具有调查能力的人员进行运营和发现数据与信息的能力。运营压力大运营人力不足</span><span style="text-indent: 28px;text-align: justify;font-family: Calibri;"><span style="font-family: 宋体;">是最常见的安全运营中心（</span>SOC<span style="font-family: 宋体;">）挑战。</span></span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">企业面临的安全挑战主要有以下几个方面：</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">1. 内部威胁对企业安全尤其重要；2.</span></strong><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">攻击越来越复杂；3.</span></strong><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">运营人力不足。</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;">UEBA解决方案从多个来源接收数据并所有数据源关联在一起，使用统计学习、机器学习等高级分析方法，对用户和实体正常行为建模，识别偏离正常行为的风险用户和风险实体，实体包括应用，主机，设备等。最后通过风险打分的形式将风险高的用户实体优先呈现给运营人员，而不会被大量告警淹没。</span><span style="text-indent: 28px;text-align: justify;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;text-align: justify;">的机器学习等高级分析方法通过行为建模进行自我调整，发现未知风险。 </span></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><p style="text-indent: 28px;text-align: center;"><br/></p><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">二、</span>UEBA<span style="font-family: 宋体;">现状及发展趋势</span></span></strong></span></h1><p><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><h1 style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">用户和实体行为分析（UEBA）是企业安全性中增长最快的领域之一，据Gartner称，其年复合增长率为48％。</span></h1><p><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><h1 style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">Gartner 2019年“Market Guide for User and Entity Behavior Analytics”指出:</span></h1><p><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">① </span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">用户和实体行为分析技术已经被大中型企业在一系列使用案例中的使用所证明。</span></strong></span></p><p><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">Gartner主要从<span style="font-family: Calibri;">3</span>个维度定义<span style="font-family: Calibri;">UEBA</span>（场景，分析方法，数据源），如下图所示：</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.7064846416382252" data-s="300,640" style="" data-type="png" data-w="293" src="https://wechat2rss.xlab.app/img-proxy/?k=ae6c30c9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6iceicUXjma8DVb0zpnG1icT1FQibrXVrDKuQJrRZ7JYo4oEicuNGhsuapoEA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;">数据：UEBA采集多源数据，例如事件日志，用户上下文数据，网络流量等等；关联更多的数据</span><span style="font-family: 宋体;text-align: justify;text-indent: 28px;">能更好刻画用户实体的行为活动，能更好的通过分析方法识别未知风险。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;text-align: justify;text-indent: 28px;"><br/></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">场景：UEBA需要清楚的定义检测或解决的场景，明确每个场景输出才能体现产品价值。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;">分析方法：多种分析方法，从传统的基于规则到UEBA采用的一系列分析方法包括规则、统计学习、有监督、无监督、深度学习、</span><span style="text-indent: 28px;text-align: justify;font-family: Calibri;">GAN</span><span style="font-family: 宋体;text-indent: 28px;text-align: justify;">等高级分析方法。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;text-align: justify;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">② </span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">UEBA可以是一种解决方案的单独产品，也可以作为<span style="font-family: Calibri;">UEBA</span>特性嵌入到其他安全产品中。未来<span style="font-family: Calibri;">UEBA</span>将以提供高级分析能力或模块的方式逐渐嵌入到<span style="font-family: Calibri;">SIEM</span>等安全产品中</span></strong><span style="text-indent: 28px;font-family: 宋体;">。</span></span></p><p><span style="font-size: 16px;text-indent: 28px;font-family: 宋体;"><br/></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;">如“</span><span style="text-indent: 28px;font-family: Calibri;">Technology Insight for the Modern SIEM</span><span style="font-family: 宋体;text-indent: 28px;">”中所述，在</span><span style="text-indent: 28px;font-family: Calibri;">2018</span><span style="font-family: 宋体;text-indent: 28px;">年和</span><span style="text-indent: 28px;font-family: Calibri;">2019</span><span style="font-family: 宋体;text-indent: 28px;">年迄今为止，我们看到</span><span style="text-indent: 28px;font-family: Calibri;">SIEM</span><span style="font-family: 宋体;text-indent: 28px;">工具和</span><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">工具之间的界限越来越模糊。</span><span style="text-indent: 28px;font-family: Calibri;"> SIEM</span><span style="font-family: 宋体;text-indent: 28px;">借助</span><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">在分析方面变得更好，并且可以提供检测复杂的场景。</span><span style="text-indent: 28px;font-family: Calibri;"> </span><span style="font-family: 宋体;text-indent: 28px;">同时，</span><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">供应商将重点放在更好的数据管理和可操作性上，这使它们更接近</span><span style="text-indent: 28px;font-family: Calibri;">SIEM</span><span style="font-family: 宋体;text-indent: 28px;">。</span></span></p><p><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;"><br/></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;">在这项研究中跟踪的UEBA产品供应商中，已经有一半还提供了</span><span style="text-indent: 28px;font-family: Calibri;">SIEM</span><span style="font-family: 宋体;text-indent: 28px;">产品，通常以不同的模块的形式提供它们，以提供更完整的威胁检测技术。</span></span></p><p><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">同样，一些SIEM供应商也逐渐将<span style="font-family: Calibri;">UEBA</span>模块嵌入到<span style="font-family: Calibri;">SIEM</span>中或提供高级分析功能。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.7641196013289037" data-s="300,640" style="" data-type="png" data-w="301" src="https://wechat2rss.xlab.app/img-proxy/?k=c5c4c8de&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icRY9s47R4Oo5sBKGeXzGVvRAbMJUf1Al9Oyqbcq5C4wlG4xAO0d802g%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">③ </span></strong><strong><span style="font-family: 宋体;">一些买家发现，UEBA的部署需要较多的时间和精力，添加新的或自定义的检测场景可能很艰巨，需要数据科学和分析方面的专业知识。</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">三、腾讯御见</span>UEBA<span style="font-family: 宋体;">及产品特性</span></span></strong></span></h1><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><h1><span style="font-size: 16px;"><strong><span style="font-family: 宋体;text-indent: 28px;">腾讯御见UEBA</span></strong><span style="font-family: 宋体;text-indent: 28px;">（用户实体行为分析）<strong>面向政企办公安全、数据安全、员工行为管理</strong>，使用一系列分析方法（统计学习、机器学习等高级分析方法）通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建<strong>用户实体画像</strong>（静态画像、动态画像），然后基于用户实体画像进行<strong>风险检测、风险分析、风险评估</strong>，最终识别<strong>内部风险用户和风险实体</strong>。</span></span></h1><p><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;"><br/></span></p><h1><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;">御见UEBA是单独的解决方案或产品，也可以作为一种高级分析能力或模块嵌入到御见</span><span style="text-indent: 28px;font-family: Calibri;">SOC</span><span style="font-family: 宋体;text-indent: 28px;">中。御见</span><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">提供两种方式：一种是</span><strong><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">单独产品</span></strong><span style="font-family: 宋体;text-indent: 28px;">；一种是</span><strong><span style="font-family: 宋体;text-indent: 28px;">嵌入到御见</span><span style="text-indent: 28px;font-family: Calibri;">SOC</span><span style="font-family: 宋体;text-indent: 28px;">作为</span><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">模块</span></strong><span style="font-family: 宋体;text-indent: 28px;">，并给产品提供高级分析能力。</span></span></h1><p style="text-indent: 28px;"><br/></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.47835051546391755" data-s="300,640" style="" data-type="png" data-w="485" src="https://wechat2rss.xlab.app/img-proxy/?k=32a6c192&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icFQtB9k4vv8DiccmE5ay37fndtgl3LHbXOPYFS5wqhcGJr2zaeWrSH5Q%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-indent: 28px;text-align: justify;font-family: 宋体;font-weight: bold;">1. </span><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">政企办公安全</span></strong><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">: </span></strong><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">保障企业办公系统安全，支持企业远程办公风险监测。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-indent: 28px;font-family: 宋体;font-weight: bold;">2. </span><strong style="text-indent: 28px;"><span style="font-family: 宋体;">数据安全治理</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">：</span></strong><span style="text-indent: 28px;font-family: 宋体;">构建企业内部数据泄露和业务数据窃取的统一监控平台。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-indent: 28px;font-family: 宋体;font-weight: bold;">3. </span><strong style="text-indent: 28px;"><span style="font-family: 宋体;">员工行为管理</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">：</span></strong><span style="text-indent: 28px;font-family: 宋体;">及时发现违规、实陷和恶意员工，构建员工多维度画像，从内部保障企业安全。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">违规用户：</span></strong></span></p><p style="text-align: left;"><span style="text-indent: 28px;text-align: justify;font-family: 宋体;font-size: 16px;">① 存在账号共享情况，共享账号带来风险；</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">② 内部高权限用户进行违规操作，违规退改；</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">③ 部分用户大量进行敏感查询并泄漏敏感信息。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">失陷用户：</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-align: justify;font-family: 宋体;text-indent: 28px;">① </span><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">账号丢失；</span></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-align: justify;font-family: 宋体;text-indent: 28px;">② </span><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">账号被暴力破解。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">恶意用户：</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-align: justify;font-family: 宋体;text-indent: 28px;">① </span><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">用户进行非法高危操作：删除数据、修改业务信息；</span></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-align: justify;font-family: 宋体;text-indent: 28px;">② </span><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">用户利用逻辑漏洞干扰正常业务；</span></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-align: justify;font-family: 宋体;text-indent: 28px;">③ </span><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">用户窃取敏感数据信息。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">产品特性：</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.49690721649484537" data-s="300,640" style="" data-type="png" data-w="485" src="https://wechat2rss.xlab.app/img-proxy/?k=a2110a72&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icH1kpvZficGVj88F0F95cb8SLZibfKgzNscib3IELwcpiarMXKGXvKCrHicg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="font-family: 宋体;text-align: left;text-indent: 28px;font-size: 16px;">御见UEBA有以下产品特性：</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-align: left;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">① 人员风险可视，行为可追溯</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">利用统一的员工身份，全面追踪风险员工行为，刻画人员行为画像（静态画像、动态画像），直观感知人员风险。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">② 应用数据打通，发现潜在威胁</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">移植SOC关联分析安全经验，关联多个应用数据，复原用户完整风险操作，识别更多潜在威胁。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">③ 灵活的自定义仪表，满足各类监控需求</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">支持自定义仪表板，提供丰富的各类风险数据监控。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">④</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;"> </span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">应用统一安全管控，全局视角</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">提供全局视角，告别单一应用单独管控，企业所有应用纳入统一安全体系。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">⑤</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;"> </span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">丰富的安全场景和模型</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">内置4大类20余种安全场景，覆盖账号安全、办公安全、数据安全和业务安全。</span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">⑥</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;"> </span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">自定义机器学习</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">检测</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">框架</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">系统支持自定义行为基线建模能力。为了缓解UEBA的部署添加新的或自定义的检测场景，需要数据科学和分析方面的专业知识，费时费力的问题，我们提供自定义机器学习检测平台，可以直接拖拽不用编写代码，方便便捷完成基线建模调试及生产环境模型部署。</span></p><h1><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></h1><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">四、腾讯御见</span>UEBA<span style="font-family: 宋体;">的产品架构</span></span></strong></span></h1><p><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><h1><span style="font-size: 16px;"><span style="text-indent: 28px;font-family: 宋体;">御见UEBA的产品架构如下图所示</span><span style="font-family: 宋体;text-indent: 28px;">：</span></span></h1><p><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.47307692307692306" data-s="300,640" style="" data-type="png" data-w="520" src="https://wechat2rss.xlab.app/img-proxy/?k=014ddd2f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icFJTnWcfM0S5I2HeNMvLJK4hT7NFCBpib1gt1aPTZqxgNGdnj13W1hUA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">用户应用数据采集：</span></strong><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">UEBA从多个数据源采集数据供后续关联分析，比如应用访问日志，堡垒机日志，主机风险日志，数据库审计日志等等。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">风险智能检测：</span></strong><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">将多源数据输入到风险智能检测引擎进行数据分析，通过统计学习、有监督无监督、异常检测等方法构建单体行为基线、群体行为基线以检测用户应用偏离基线等潜在风险。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">用户应用风险输出</span></strong><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">：通过统计学习、机器学习等一系列分析方法识别应用风险、数据风险、人员风险、计算环境安全风险。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">风险监控调查：</span></strong><span style="text-indent: 28px;font-family: 宋体;">统计各项应用运营指标，企业应用整体运营状况一目了然。持续监控应用运行风险，应用安全心中有数；多种算法规则感知企业应用风险，应用和人员风险全面感知。</span></span></p><h1><br/></h1><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">五、腾讯御见</span>UEBA<span style="font-family: 宋体;">主要功能</span></span></strong></span></h1><p><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><h1><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">腾讯御见UEBA提供多源数据接入、日志检索、用户实体画像、用户实体风险分析、用户权限梳理、应用业务梳理、用户实体风险评分、仪表盘、AI检测平台等多种功能。</span></h1><p><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;">其中</span><strong><span style="font-family: 宋体;">核心功能</span></strong><span style="font-family: 宋体;">主要有：</span><strong><span style="font-family: 宋体;">用户实体画像、用户实体风险分析、用户权限梳理、应用业务梳理、用户实体风险评分</span></strong><span style="font-family: 宋体;">等。</span></span></p><p><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">特色功能</span></strong><span style="font-family: 宋体;">有：</span><strong><span style="font-family: 宋体;">AI</span></strong><strong><span style="font-family: 宋体;">自定义</span></strong><strong><span style="font-family: 宋体;">检测平台</span></strong><span style="font-family: 宋体;">（可配置的基线建模平台）</span></span></p><p><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">下面结合UEBA产品，进行简单介绍。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">御见UEBA会从用户和应用的视角，基于多源日志进行大数据分析，刻画用户实体静态画像和动态画像，并基于画像信息进行风险评估，并利用用户实体的综合风险分排序及风险画像信息、风险评估信息进行进一步运营调查。</span></p><p><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">用户实体风险评分</span></strong><strong><span style="font-family: 宋体;">：</span></strong><span style="font-family: 宋体;">风险量化评分会经过风险打分，风险合并等多种方式明确需要优先处理的人员和应用，减轻运营人员运营压力。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.897742363877822" data-s="300,640" style="" data-type="png" data-w="753" src="https://wechat2rss.xlab.app/img-proxy/?k=654bd959&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icCOSShCGSWuI4apvhX3ibCXkC7CicEWXoWF2ZdhYrBdRnWib937RAFadyw%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">行为分析首页</span></strong></span></p><p style="text-align: center;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">用户实体画像</span></strong><strong><span style="font-family: 宋体;">：</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">御见</span>UEBA<span style="font-family: 宋体;">分析的对象主要包括用户、设备、资产、应用等等，建立用户实体画像库，持续丰富更新用户实体的</span></span><strong><span style="font-family: 宋体;">静态画像和动态画像</span></strong><span style="font-family: 宋体;">。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"></span></span><br/></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"></span></span><img class="rich_pages js_insertlocalimg" data-ratio="0.8985823336968375" data-s="300,640" style="text-align: center;width: 180px;height: 162px;" data-type="png" data-w="917" src="https://wechat2rss.xlab.app/img-proxy/?k=d0068fe3&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icCY7BW4ial7OCB5ic4x5f1zluuxDKIGKhCaRBa12xG5psfo1XCXGMrXHw%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.9257075471698113" data-s="300,640" style="height: 163px;text-align: center;white-space: normal;width: 176px;" data-type="png" data-w="848" src="https://wechat2rss.xlab.app/img-proxy/?k=9640c315&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icHllGcYj7kkAuia0lnyNT92PJxoWwqkSndUNHSfkKfWJ0FwOWxgANVdg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-indent: 28px;text-align: left;"><span style="font-size: 16px;">       </span><span style="font-size: 12px;"><strong style="text-align: justify;"><span style="font-size: 12px;font-family: 宋体;">用户静态画像</span></strong><span style="font-size: 12px;text-align: justify;font-family: Calibri;">  </span><span style="font-size: 12px;text-align: justify;font-family: 宋体;">                         </span></span><strong style="text-align: justify;font-size: 16px;"><span style="font-size: 12px;font-family: 宋体;">应用静态画</span></strong><strong style="font-size: 16px;text-align: justify;"><span style="font-size: 12px;font-family: 宋体;">像</span></strong><img class="rich_pages js_insertlocalimg" data-ratio="0.9243306169965075" data-s="300,640" style="text-align: center;width: 185px;height: 171px;" data-type="png" data-w="859" src="https://wechat2rss.xlab.app/img-proxy/?k=8a8fd24e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icDt4qQicudDjSIv5L2Zcia4rxeKK9OYYib90DkEOCZ3ogSVjndjJFg1G1Q%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.9493521790341578" data-s="300,640" style="text-align: center;width: 179px;height: 170px;" data-type="png" data-w="849" src="https://wechat2rss.xlab.app/img-proxy/?k=8f4c3782&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icYG74OJYyQbwbNhr4WRTj8oCfN1LKgv87V03Qb3ic2apwP0nZdhqjdsg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">           </span></strong></span><strong><span style="font-size: 12px;text-align: justify;font-family: 宋体;">用户动态画像                         应用动态画像</span></strong></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">用户</span>/<span style="font-family: 宋体;">应用行为风险评估</span><span style="font-family: Calibri;">: </span></span></strong><span style="font-family: 宋体;">综合静态画像和动态画像完整了刻画用户实体，后续可基于画像数据进行</span><strong><span style="font-family: 宋体;">风险检测、风险分析、风险评估</span></strong><span style="font-family: 宋体;">等等；并以操作行为时间线及风险原因数据下钻举证的形式展现。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p><img class="rich_pages js_insertlocalimg" data-ratio="0.7565308254963428" data-s="300,640" style="text-align: center;width: 187px;height: 141px;" data-type="png" data-w="957" src="https://wechat2rss.xlab.app/img-proxy/?k=cccb83de&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icqnRZ59my4PFVvy5ZeOeKS329ZUsOpqOeUVk4SFv8kNfdWfpaI6iaZbg%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.7688338493292054" data-s="300,640" style="text-align: center;width: 184px;height: 141px;" data-type="png" data-w="969" src="https://wechat2rss.xlab.app/img-proxy/?k=d1eb76af&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6ic0ia4JEP9z3UtCLzWNJsM3iaY7SIfm3To98H0YibfzjichBOIxLa815BTaQ%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">      </span></strong></span><span style="font-size: 12px;"><strong><span style="font-size: 12px;font-family: 宋体;"><span style="font-family: 宋体;">操作行为时间线</span>                       </span></strong><strong style="font-size: 16px;"><span style="font-size: 12px;font-family: 宋体;">风险评估原因举证</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">业务</span>/<span style="font-family: 宋体;">账号梳理</span><span style="font-family: Calibri;">:</span></span></strong><span style="font-family: 宋体;"> <span style="font-family: 宋体;">对客户的业务及账号进行梳理，直观展示应用系统业务接口和当前用户账号使用情况，列举</span></span><strong><span style="font-family: 宋体;">静默账号</span></strong><span style="font-family: 宋体;">等风险账号，梳理各接口访问及</span><strong><span style="font-family: 宋体;">失活接口</span></strong><span style="font-family: 宋体;">等风险状况，发现被安全运营人员忽视的业务接口，了解自身业务攻击面。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"></span></span><img class="rich_pages js_insertlocalimg" data-ratio="0.7615298087739033" data-s="300,640" style="text-align: center;width: 189px;height: 144px;" data-type="png" data-w="889" src="https://wechat2rss.xlab.app/img-proxy/?k=43f60cef&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icAujTQ3diaHeDNata6NWXY09CSXVfIAOUNCvge7Dib7nyAAW1kia0phS9w%2F640%3Fwx_fmt%3Dpng"/><span style="text-align: center;"></span><img class="rich_pages js_insertlocalimg" data-ratio="0.7987012987012987" data-s="300,640" style="text-align: center;width: 179px;height: 143px;" data-type="png" data-w="924" src="https://wechat2rss.xlab.app/img-proxy/?k=88eb68bf&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icoCxv0NkhnrxFmY3auia4fgMYpLukD5ErF3gObibUsZaMaHDiaxqibTHmTQ%2F640%3Fwx_fmt%3Dpng"/><span style="text-align: center;"></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-align: justify;"><span style="font-family: 宋体;">        </span></strong></span><span style="font-size: 12px;"><strong style="text-align: justify;"><span style="font-size: 12px;font-family: 宋体;"> 账号梳理                             </span></strong><strong style="text-align: justify;"><span style="font-size: 12px;font-family: 宋体;">账号详情</span></strong></span><img class="rich_pages js_insertlocalimg" data-ratio="0.7722095671981777" data-s="300,640" style="text-align: center;width: 176px;height: 136px;" data-type="png" data-w="878" src="https://wechat2rss.xlab.app/img-proxy/?k=40d768c0&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icuT3AVcOdmItYIk8l2HbMVS3C6kVBhS4a2LNEnyWbQEfcWvXofhEAGA%2F640%3Fwx_fmt%3Dpng"/><span style="text-align: center;"></span><img class="rich_pages js_insertlocalimg" data-ratio="0.6609808102345416" data-s="300,640" style="text-align: center;width: 203px;height: 134px;" data-type="png" data-w="938" src="https://wechat2rss.xlab.app/img-proxy/?k=593f36e7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icrAo0KdrpjpKY0WzzNmf1FU6UExEwE1xeezPqOLp8muR2DwdfTUickTw%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">         </span></strong></span><span style="font-size: 12px;"><strong><span style="font-size: 12px;font-family: 宋体;"><span style="font-size: 12px;font-family: 宋体;">业务梳理</span>                             <span style="font-size: 12px;font-family: 宋体;">业务详情</span></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></strong></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">可配置的基线建模平台：</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">产品集成了可配置的行为基线建模平台用来进行行为基线建模，平台内置了</span>30+<span style="font-family: 宋体;">种特征提取转换函数、</span><span style="font-family: Calibri;">6</span><span style="font-family: 宋体;">种统计算子；</span><span style="font-family: Calibri;">7</span><span style="font-family: 宋体;">种行为基线建模算法；</span><span style="font-family: Calibri;">3</span><span style="font-family: 宋体;">种策略去误报方法；用户只需要通过</span></span><strong><span style="font-family: 宋体;">简单拖拽</span></strong><span style="font-family: 宋体;">的方式即可完成基线建模，</span><strong><span style="font-family: 宋体;">无需编写代码</span></strong><span style="font-family: 宋体;">。</span></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">可配置的基线建模平台的优点：</span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">①清晰明确的向客户展示基线建模过程中所使用的数据、特征、算法、策略等各个模块信息及整个基线建模的流程。</span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">②开放基线建模能力给用户，直接拖拽不用编写代码即可快速完成基线建模。</span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"></span><img class="rich_pages js_insertlocalimg" data-ratio="0.5942622950819673" data-s="300,640" style="text-align: center;width: 178px;height: 106px;" data-type="png" data-w="976" src="https://wechat2rss.xlab.app/img-proxy/?k=9adf2ad7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6ic23VcFFxiaHHvmu9ojbWDEMUwq1qMUIDI84zKhewAIlcQ6EIEiags4edQ%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.5613496932515337" data-s="300,640" style="text-align: center;width: 190px;height: 107px;" data-type="png" data-w="978" src="https://wechat2rss.xlab.app/img-proxy/?k=f9237d42&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6ic5ic6ANjvk9Q2XyOF7TRR1YuSPmq5zBnskS7rJD06ZpcXvhkcNzanLXw%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">     </span></strong></span><span style="font-size: 12px;"><strong><span style="font-size: 12px;font-family: 宋体;"><span style="font-size: 12px;font-family: 宋体;">场景自定义</span>                            <span style="font-size: 12px;font-family: 宋体;">基线建模任务流</span></span></strong></span></p><p><br/></p><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-size: 20px;font-family: 宋体;"><span style="font-size: 20px;font-family: 宋体;">六、御见</span>UEBA<span style="font-size: 20px;font-family: 宋体;">典型场景</span></span></strong></span></h1><p><span style="font-size: 20px;"><strong><span style="font-size: 20px;font-family: 宋体;"><span style="font-size: 20px;font-family: 宋体;"><br/></span></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">御见UEBA内置了<span style="font-family: Calibri;">4</span>类<span style="font-family: Calibri;">20</span>多种典型场景以覆盖账号安全、办公安全、数据安全和业务安全，包括账号风险，离职员工权限风险，内部数据窃取，研发凭证外泄风险，研发数据泄漏风险，研发运维恶意操作等等。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">账号风险：</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">针对企业员工</span>VPN<span style="font-family: 宋体;">、</span><span style="font-family: Calibri;">OA</span><span style="font-family: 宋体;">等办公应用账号被攻击者窃取的风险监控。</span></span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">离职员工权限风险</span></strong><span style="font-family: 宋体;">：针对离职员工仍然具有权限，登录办公应用或业务系统的风险监控。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">内部数据窃取：</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">针对企业员工对内部</span>OA<span style="font-family: 宋体;">、</span><span style="font-family: Calibri;">HR</span><span style="font-family: 宋体;">等系统数据的异常访问和窃取风险监控。</span></span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">研发凭证外泄风险：</span></strong><span style="font-family: 宋体;">针对研发运维账号外泄，存在外部异常登录行为的监控。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">研发数据泄漏风险：</span></strong><span style="font-family: 宋体;">针对内部源代码、数据库等研发数据泄漏风险的监控。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">研发运维恶意操作</span></strong><span style="font-family: 宋体;">：针对研发运维人员的高风险操作检测，以及异常行为预警。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p><span style="font-family: 宋体;font-size: 16px;">典型场景示例：</span></p><p><br/></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;font-weight: bold;">1. </span><strong><span style="font-family: 宋体;">用户账号失陷检测</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">① 内部人员误点钓鱼邮件，泄露账号密码。</span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">② 黑客使用内部账号密码登录OA、营销、财经等多个内部系统，寻找有价值数据，找到数据后尝试大量下载。</span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">③ 御见UEBA通过对内部人员进行行为画像，建立安全基线，检测到多种行为异常，关联分析发现疑似内部人员账号失陷，及时告警。</span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">④ 安全运营人员及时联系员工确认，并封禁该员工权限。</span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">⑤ 安全运营人员借助应用安全中心对该账号行为进行审计，确认涉及的内部系统，查询其他内部系统监控记录，确认最终影响范围。</span></p><p style="text-indent: 28px;"><br/></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="1.54" data-s="300,640" style="" data-type="png" data-w="150" src="https://wechat2rss.xlab.app/img-proxy/?k=68098920&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6iclfJTsnyLicebCd9ENkn8dgLAkAsDQp1gofynUBCExo5DJHRqZt9Q4kA%2F640%3Fwx_fmt%3Dpng"/></p><p><br/></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;font-weight: bold;">2. </span><strong><span style="font-family: 宋体;">应用数据泄露检测</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.30707070707070705" data-s="300,640" style="" data-type="png" data-w="495" src="https://wechat2rss.xlab.app/img-proxy/?k=e3358a2e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icgK8qia3BmERbLYSz3ev7FvXR315iaIkYMTaAPHZ6NgsEqQaWgzWlZPcA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><br/></p><p style="text-align: left;"><span style="text-indent: 28px;text-align: justify;font-family: 宋体;font-size: 16px;">① 应用出现逻辑漏洞。</span></p><p style="text-align: left;"><span style="text-indent: 28px;text-align: justify;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">② 黑客通过该暴露的漏洞，大量获取应用数据。</span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">③ 黑客为绕过访问频率限制，控制多个账号去尝试获取数据。</span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">④ 御见UEBA通过应用整体运行监控，发现应用访问量异常、访问用户量异常，同时发现部分用户访问行为异常，及时告警。</span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">⑤ 运营人员根据告警判断出现数据泄露，根据应用安全中心风险检测结果定位到风险接口，协助修复漏洞，防止进一步数据泄露。</span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">⑥ 根据检测得到的多个黑客控制的风险账号的行为记录，以及应用的访问记录和数据访问记录，评估数据泄露规模，进行进一步总结整改。</span></p><p style="text-indent: 28px;text-align: left;"><br/></p><p><br/></p><p><span style="font-family: 宋体;font-size: 14px;">参考资料：</span></p><p><span style="font-family: 宋体;font-size: 14px;">2019Gartner, Market Guide for User and Entity Behavior Analytics</span></p><p><span style="font-family: 宋体;font-size: 14px;">2019Gartner, Market Trends: UEBA Providers Must Embrace Specialization</span></p><p><span style="font-family: 宋体;font-size: 14px;">2019Verizon, 2019 Data Breach Investigations report</span></p><p><span style="font-family: 宋体;font-size: 14px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="1" data-s="300,640" data-w="258" data-type="jpeg" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(53, 53, 53);letter-spacing: 0.544px;text-align: start;font-size: 15px;box-sizing: border-box !important;overflow-wrap: break-word !important;">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。欢迎关注~</span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br style="white-space: normal;"/></p><p><span style="font-family: 宋体;font-size: 14px;"><br/></span><br/></p>



<p><a href="2247484137">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=24d0b914&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484137%26idx%3D1%26sn%3Db76de04805ec6a87e77430201dc4948f%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Tue, 14 Jul 2020 12:00:00 +0800</pubDate>
    </item>
    <item>
      <title>腾讯御见UEBA</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484122&amp;idx=1&amp;sn=7efcfcca22973a091c4ae40d92b6c4b9</link>
      <description>腾讯御见UEBA面向政企办公安全、数据安全治理、员工行为管理，使用一系列分析方法通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建用户实体画像，然后基于用户实体画像进行风险检测、风险分析、风险评估，最终识别内部风险用户和风险实体。</description>
      <content:encoded><![CDATA[<p>
原创 <span>御见UEBA团队</span> <span>2020-07-13 12:37</span> <span style="display: inline-block;"></span>
</p>

<p>腾讯御见UEBA面向政企办公安全、数据安全治理、员工行为管理，使用一系列分析方法通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建用户实体画像，然后基于用户实体画像进行风险检测、风险分析、风险评估，最终识别内部风险用户和风险实体。</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=5b438e5e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6iclRKVs4HWaFObnsPqftGVQquC0p3jkr1WCjkoowhZwtLd6x3icHo3Jyg%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p style="text-align: left;"><strong><span style="font-size: 16px;font-family: 宋体;">引子：</span></strong><span style="font-size: 16px;"><span style="font-family: 宋体;"><span style="font-family: 宋体;">腾讯御见</span>UEBA<span style="font-family: 宋体;">（用户实体行为分析）面向政企办公安全、数据安全治理、员工行为管理，使用一系列分析方法（统计学习、机器学习等</span></span><strong><span style="font-family: 宋体;">高级分析方法</span></strong><span style="font-family: 宋体;">）通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建</span><strong><span style="font-family: 宋体;">用户实体画像</span></strong><span style="font-family: 宋体;">（静态画像、动态画像），然后基于用户实体画像进行</span><strong><span style="font-family: 宋体;">风险检测、风险分析、风险评估，</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">最终识别内部风险用户和风险实体。御见</span>UEBA<span style="font-family: 宋体;">是单独的解决方案或产品，也可以作为一种高级分析能力或模块嵌入到御见</span>SOC<span style="font-family: 宋体;">中。目前我们御见</span><span style="font-family: Calibri;">UEBA</span><span style="font-family: 宋体;">产品最新版本已经发布，本文会结合最新版本对御见</span><span style="font-family: Calibri;">UEBA</span><span style="font-family: 宋体;">进行简单介绍。</span></span></span></p><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.2720970537261698" data-s="300,640" style="" data-type="png" data-w="577" src="https://wechat2rss.xlab.app/img-proxy/?k=cc062fe8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icPuRnXiag2UnhkXtNApJ5TjuYXGkicuKnBBoaQhV2pJEicg3zldoFCIPuQ%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: justify;margin: 0pt;text-indent: 0pt;padding: 0pt;"><span style="font-size: 16px;"><br/></span></p><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-family: 宋体;">一、背景</span></strong></span><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"></span></strong></span></h1><p><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;font-size: 16px;">2019 verizon数据泄露调查报告指出，<span style="font-family: Calibri;">34%</span>的数据泄露涉及企业内部人员。内部人员对企业构成了特殊的威胁，传统安全产品无法检测，因为他们有权限访问内部系统，通常能够绕过安全措施，从而给安全团队造成安全盲点。大多数网络安全专家都认为，企业网络安全系统中最薄弱的环节是其员工。据网络安全咨询公司<span style="font-family: Calibri;">CrowdStrike</span>研究发现，百分之五到百分之十的员工会点击钓鱼邮件，点击钓鱼邮件受害者的计算机将自动运行恶意程序并被完全控制，攻击者进而通过合法的身份账号做数据窃取等不法操作而不被发现。内部威胁，内部人员风险对企业安全尤其重要。</span></p><p style="text-align: left;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">攻击变得越来越复杂，传统安全解决方案大多基于规则的单点检测，往往检测不到或发现更多未知威胁。针对越来越复杂的攻击，需要打破单点检测引入行为分析等高级分析方法。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">在SANS研究所最近的一项调查中，受访者确定了安全组织的三大优先事项：更好的调查功能，更多具有调查能力的人员进行运营和发现数据与信息的能力。运营压力大运营人力不足</span><span style="text-indent: 28px;text-align: justify;font-family: Calibri;"><span style="font-family: 宋体;">是最常见的安全运营中心（</span>SOC<span style="font-family: 宋体;">）挑战。</span></span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">企业面临的安全挑战主要有以下几个方面：</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">1. 内部威胁对企业安全尤其重要；2.</span></strong><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">攻击越来越复杂；3.</span></strong><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">运营人力不足。</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;">UEBA解决方案从多个来源接收数据并所有数据源关联在一起，使用统计学习、机器学习等高级分析方法，对用户和实体正常行为建模，识别偏离正常行为的风险用户和风险实体，实体包括应用，主机，设备等。最后通过风险打分的形式将风险高的用户实体优先呈现给运营人员，而不会被大量告警淹没。</span><span style="text-indent: 28px;text-align: justify;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;text-align: justify;">的机器学习等高级分析方法通过行为建模进行自我调整，发现未知风险。 </span></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><p style="text-indent: 28px;text-align: center;"><br/></p><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">二、</span>UEBA<span style="font-family: 宋体;">现状及发展趋势</span></span></strong></span></h1><p><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><h1 style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">用户和实体行为分析（UEBA）是企业安全性中增长最快的领域之一，据Gartner称，其年复合增长率为48％。</span></h1><p><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><h1 style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">Gartner 2019年“Market Guide for User and Entity Behavior Analytics”指出:</span></h1><p><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">① </span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">用户和实体行为分析技术已经被大中型企业在一系列使用案例中的使用所证明。</span></strong></span></p><p><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">Gartner主要从<span style="font-family: Calibri;">3</span>个维度定义<span style="font-family: Calibri;">UEAB</span>（场景，分析方法，数据源），如下图所示：</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.7064846416382252" data-s="300,640" style="" data-type="png" data-w="293" src="https://wechat2rss.xlab.app/img-proxy/?k=ae6c30c9&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6iceicUXjma8DVb0zpnG1icT1FQibrXVrDKuQJrRZ7JYo4oEicuNGhsuapoEA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;">数据：UEBA采集多源数据，例如事件日志，用户上下文数据，网络流量等等；关联更多的数据</span><span style="font-family: 宋体;text-align: justify;text-indent: 28px;">能更好刻画用户实体的行为活动，能更好的通过分析方法识别未知风险。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;text-align: justify;text-indent: 28px;"><br/></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">场景：UEBA需要清楚的定义检测或解决的场景，明确每个场景输出才能体现产品价值。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;">分析方法：多种分析方法，从传统的基于规则到UEBA采用的一系列分析方法包括规则、统计学习、有监督、无监督、深度学习、</span><span style="text-indent: 28px;text-align: justify;font-family: Calibri;">GAN</span><span style="font-family: 宋体;text-indent: 28px;text-align: justify;">等高级分析方法。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;text-align: justify;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">② </span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">UEBA可以是一种解决方案的单独产品，也可以作为<span style="font-family: Calibri;">UEBA</span>特性嵌入到其他安全产品中。未来<span style="font-family: Calibri;">UEBA</span>将以提供高级分析能力或模块的方式逐渐嵌入到<span style="font-family: Calibri;">SIME</span>等安全产品中</span></strong><span style="text-indent: 28px;font-family: 宋体;">。</span></span></p><p><span style="font-size: 16px;text-indent: 28px;font-family: 宋体;"><br/></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;">如“</span><span style="text-indent: 28px;font-family: Calibri;">Technology Insight for the Modern SIEM</span><span style="font-family: 宋体;text-indent: 28px;">”中所述，在</span><span style="text-indent: 28px;font-family: Calibri;">2018</span><span style="font-family: 宋体;text-indent: 28px;">年和</span><span style="text-indent: 28px;font-family: Calibri;">2019</span><span style="font-family: 宋体;text-indent: 28px;">年迄今为止，我们看到</span><span style="text-indent: 28px;font-family: Calibri;">SIEM</span><span style="font-family: 宋体;text-indent: 28px;">工具和</span><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">工具之间的界限越来越模糊。</span><span style="text-indent: 28px;font-family: Calibri;"> SIEM</span><span style="font-family: 宋体;text-indent: 28px;">借助</span><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">在分析方面变得更好，并且可以提供检测复杂的场景。</span><span style="text-indent: 28px;font-family: Calibri;"> </span><span style="font-family: 宋体;text-indent: 28px;">同时，</span><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">供应商将重点放在更好的数据管理和可操作性上，这使它们更接近</span><span style="text-indent: 28px;font-family: Calibri;">SIEM</span><span style="font-family: 宋体;text-indent: 28px;">。</span></span></p><p><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;"><br/></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;">在这项研究中跟踪的UEBA产品供应商中，已经有一半还提供了</span><span style="text-indent: 28px;font-family: Calibri;">SIEM</span><span style="font-family: 宋体;text-indent: 28px;">产品，通常以不同的模块的形式提供它们，以提供更完整的威胁检测技术。</span></span></p><p><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">同样，一些SIEM供应商也逐渐将<span style="font-family: Calibri;">UEBA</span>模块嵌入到<span style="font-family: Calibri;">SIEM</span>中或提供高级分析功能。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.7641196013289037" data-s="300,640" style="" data-type="png" data-w="301" src="https://wechat2rss.xlab.app/img-proxy/?k=c5c4c8de&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icRY9s47R4Oo5sBKGeXzGVvRAbMJUf1Al9Oyqbcq5C4wlG4xAO0d802g%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">③ </span></strong><strong><span style="font-family: 宋体;">一些买家发现，UEBA的部署需要较多的时间和精力，添加新的或自定义的检测场景可能很艰巨，需要数据科学和分析方面的专业知识。</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">三、腾讯御见</span>UEBA<span style="font-family: 宋体;">及产品特性</span></span></strong></span></h1><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><h1><span style="font-size: 16px;"><strong><span style="font-family: 宋体;text-indent: 28px;">腾讯御见UEBA</span></strong><span style="font-family: 宋体;text-indent: 28px;">（用户实体行为分析）<strong>面向政企办公安全、数据安全、员工行为管理</strong>，使用一系列分析方法（统计学习、机器学习等高级分析方法）通过分析用户实体（用户、应用、设备、主机等）相关行为日志构建<strong>用户实体画像</strong>（静态画像、动态画像），然后基于用户实体画像进行<strong>风险检测、风险分析、风险评估</strong>，最终识别<strong>内部风险用户和风险实体</strong>。</span></span></h1><p><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;"><br/></span></p><h1><span style="font-size: 16px;"><span style="font-family: 宋体;text-indent: 28px;">御见UEBA是单独的解决方案或产品，也可以作为一种高级分析能力或模块嵌入到御见</span><span style="text-indent: 28px;font-family: Calibri;">SOC</span><span style="font-family: 宋体;text-indent: 28px;">中。御见</span><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">提供两种方式：一种是</span><strong><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">单独产品</span></strong><span style="font-family: 宋体;text-indent: 28px;">；一种是</span><strong><span style="font-family: 宋体;text-indent: 28px;">嵌入到御见</span><span style="text-indent: 28px;font-family: Calibri;">SOC</span><span style="font-family: 宋体;text-indent: 28px;">作为</span><span style="text-indent: 28px;font-family: Calibri;">UEBA</span><span style="font-family: 宋体;text-indent: 28px;">模块</span></strong><span style="font-family: 宋体;text-indent: 28px;">，并给产品提供高级分析能力。</span></span></h1><p style="text-indent: 28px;"><br/></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.47835051546391755" data-s="300,640" style="" data-type="png" data-w="485" src="https://wechat2rss.xlab.app/img-proxy/?k=32a6c192&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icFQtB9k4vv8DiccmE5ay37fndtgl3LHbXOPYFS5wqhcGJr2zaeWrSH5Q%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-indent: 28px;text-align: justify;font-family: 宋体;font-weight: bold;">1. </span><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">政企办公安全</span></strong><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">: </span></strong><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">保障企业办公系统安全，支持企业远程办公风险监测。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-indent: 28px;font-family: 宋体;font-weight: bold;">2. </span><strong style="text-indent: 28px;"><span style="font-family: 宋体;">数据安全治理</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">：</span></strong><span style="text-indent: 28px;font-family: 宋体;">构建企业内部数据泄露和业务数据窃取的统一监控平台。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-indent: 28px;font-family: 宋体;font-weight: bold;">3. </span><strong style="text-indent: 28px;"><span style="font-family: 宋体;">员工行为管理</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">：</span></strong><span style="text-indent: 28px;font-family: 宋体;">及时发现违规、实陷和恶意员工，构建员工多维度画像，从内部保障企业安全。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">违规用户：</span></strong></span></p><p style="text-align: left;"><span style="text-indent: 28px;text-align: justify;font-family: 宋体;font-size: 16px;">① 存在账号共享情况，共享账号带来风险；</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">② 内部高权限用户进行违规操作，违规退改；</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;">③ 部分用户大量进行敏感查询并泄漏敏感信息。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;text-align: justify;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">失陷用户：</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-align: justify;font-family: 宋体;text-indent: 28px;">① </span><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">账号丢失；</span></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-align: justify;font-family: 宋体;text-indent: 28px;">② </span><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">账号被暴力破解。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">恶意用户：</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-align: justify;font-family: 宋体;text-indent: 28px;">① </span><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">用户进行非法高危操作：删除数据、修改业务信息；</span></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-align: justify;font-family: 宋体;text-indent: 28px;">② </span><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">用户利用逻辑漏洞干扰正常业务；</span></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="text-align: justify;font-family: 宋体;text-indent: 28px;">③ </span><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">用户窃取敏感数据信息。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">产品特性：</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.49690721649484537" data-s="300,640" style="" data-type="png" data-w="485" src="https://wechat2rss.xlab.app/img-proxy/?k=a2110a72&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icH1kpvZficGVj88F0F95cb8SLZibfKgzNscib3IELwcpiarMXKGXvKCrHicg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="font-family: 宋体;text-align: left;text-indent: 28px;font-size: 16px;">御见UEBA有以下产品特性：</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-align: left;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">① 人员风险可视，行为可追溯</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">利用统一的员工身份，全面追踪风险员工行为，刻画人员行为画像（静态画像、动态画像），直观感知人员风险。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">② 应用数据打通，发现潜在威胁</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">移植SOC关联分析安全经验，关联多个应用数据，复原用户完整风险操作，识别更多潜在威胁。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">③ 灵活的自定义仪表，满足各类监控需求</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">支持自定义仪表板，提供丰富的各类风险数据监控。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">④</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;"> </span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">应用统一安全管控，全局视角</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">提供全局视角，告别单一应用单独管控，企业所有应用纳入统一安全体系。</span></p><p style="text-align: left;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">⑤</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;"> </span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">丰富的安全场景和模型</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">内置4大类20余种安全场景，覆盖账号安全、办公安全、数据安全和业务安全。</span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">⑥</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;"> </span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">自定义机器学习</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">检测</span></strong><strong style="text-indent: 28px;"><span style="font-family: 宋体;">框架</span></strong></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">系统支持自定义行为基线建模能力。为了缓解UEBA的部署添加新的或自定义的检测场景，需要数据科学和分析方面的专业知识，费时费力的问题，我们提供自定义机器学习检测平台，可以直接拖拽不用编写代码，方便便捷完成基线建模调试及生产环境模型部署。</span></p><h1><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></h1><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">四、腾讯御见</span>UEBA<span style="font-family: 宋体;">的产品架构</span></span></strong></span></h1><p><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><h1><span style="font-size: 16px;"><span style="text-indent: 28px;font-family: 宋体;">御见UEBA的产品架构如下图所示</span><span style="font-family: 宋体;text-indent: 28px;">：</span></span></h1><p><span style="font-size: 16px;font-family: 宋体;text-indent: 28px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.47307692307692306" data-s="300,640" style="" data-type="png" data-w="520" src="https://wechat2rss.xlab.app/img-proxy/?k=014ddd2f&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icFJTnWcfM0S5I2HeNMvLJK4hT7NFCBpib1gt1aPTZqxgNGdnj13W1hUA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">用户应用数据采集：</span></strong><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">UEBA从多个数据源采集数据供后续关联分析，比如应用访问日志，堡垒机日志，主机风险日志，数据库审计日志等等。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">风险智能检测：</span></strong><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">将多源数据输入到风险智能检测引擎进行数据分析，通过统计学习、有监督无监督、异常检测等方法构建单体行为基线、群体行为基线以检测用户应用偏离基线等潜在风险。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;text-align: justify;"><span style="font-family: 宋体;">用户应用风险输出</span></strong><span style="text-indent: 28px;text-align: justify;font-family: 宋体;">：通过统计学习、机器学习等一系列分析方法识别应用风险、数据风险、人员风险、计算环境安全风险。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;text-indent: 28px;text-align: justify;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">风险监控调查：</span></strong><span style="text-indent: 28px;font-family: 宋体;">统计各项应用运营指标，企业应用整体运营状况一目了然。持续监控应用运行风险，应用安全心中有数；多种算法规则感知企业应用风险，应用和人员风险全面感知。</span></span></p><h1><br/></h1><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">五、腾讯御见</span>UEBA<span style="font-family: 宋体;">主要功能</span></span></strong></span></h1><p><span style="font-size: 20px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><h1><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">腾讯御见UEBA提供多源数据接入、日志检索、用户实体画像、用户实体风险分析、用户权限梳理、应用业务梳理、用户实体风险评分、仪表盘、AI检测平台等多种功能。</span></h1><p><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;">其中</span><strong><span style="font-family: 宋体;">核心功能</span></strong><span style="font-family: 宋体;">主要有：</span><strong><span style="font-family: 宋体;">用户实体画像、用户实体风险分析、用户权限梳理、应用业务梳理、用户实体风险评分</span></strong><span style="font-family: 宋体;">等。</span></span></p><p><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">特色功能</span></strong><span style="font-family: 宋体;">有：</span><strong><span style="font-family: 宋体;">AI</span></strong><strong><span style="font-family: 宋体;">自定义</span></strong><strong><span style="font-family: 宋体;">检测平台</span></strong><span style="font-family: 宋体;">（可配置的基线建模平台）</span></span></p><p><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p><span style="font-family: 宋体;font-size: 16px;">下面结合UEBA产品，进行简单介绍。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">御见UEBA会从用户和应用的视角，基于多源日志进行大数据分析，刻画用户实体静态画像和动态画像，并基于画像信息进行风险评估，并利用用户实体的综合风险分排序及风险画像信息、风险评估信息进行进一步运营调查。</span></p><p><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">用户实体风险评分</span></strong><strong><span style="font-family: 宋体;">：</span></strong><span style="font-family: 宋体;">风险量化评分会经过风险打分，风险合并等多种方式明确需要优先处理的人员和应用，减轻运营人员运营压力。</span></span></p><p><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.8973747016706444" data-s="300,640" style="" data-type="png" data-w="419" src="https://wechat2rss.xlab.app/img-proxy/?k=e0f7e407&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icZYOoibvhNc3NTUoeYjliamhvIrwwKn5JJppJjrXByc8hQGErc4aib2ichA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">行为分析首页</span></strong></span></p><p style="text-align: center;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">用户实体画像</span></strong><strong><span style="font-family: 宋体;">：</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">御见</span>UEBA<span style="font-family: 宋体;">分析的对象主要包括用户、设备、资产、应用等等，建立用户实体画像库，持续丰富更新用户实体的</span></span><strong><span style="font-family: 宋体;">静态画像和动态画像</span></strong><span style="font-family: 宋体;">。</span></span></p><p><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><img class="rich_pages js_insertlocalimg" data-ratio="0.8978102189781022" data-s="300,640" style="width: 181px;height: 163px;" data-type="png" data-w="274" src="https://wechat2rss.xlab.app/img-proxy/?k=cf7e85e8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icG1VK5r95n5abWo23VQSdh1YZXpH15RibiccoCDFOUice4curQ5ZIBrVaw%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.8909090909090909" data-s="300,640" style="text-align: center;width: 182px;height: 162px;" data-type="png" data-w="275" src="https://wechat2rss.xlab.app/img-proxy/?k=c639cc24&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icicNTIlWX6BkUDqeF0G7dTib7sBoqqliamdDrm7fUIQJqrbpR7XPNXwwVg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-indent: 28px;text-align: left;"><span style="font-size: 16px;">       </span><span style="font-size: 12px;"><strong style="text-align: justify;"><span style="font-size: 12px;font-family: 宋体;">用户静态画像</span></strong><span style="font-size: 12px;text-align: justify;font-family: Calibri;">  </span><span style="font-size: 12px;text-align: justify;font-family: 宋体;">                         </span></span><strong style="text-align: justify;font-size: 16px;"><span style="font-size: 12px;font-family: 宋体;">应用静态画</span></strong><strong style="font-size: 16px;text-align: justify;"><span style="font-size: 12px;font-family: 宋体;">像</span></strong></p><p style="text-align: left;"><img class="rich_pages js_insertlocalimg" data-ratio="0.9266409266409267" data-s="300,640" style="width: 183px;height: 170px;" data-type="png" data-w="259" src="https://wechat2rss.xlab.app/img-proxy/?k=fefa4776&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icYGicBvZQciaaTOyiajK8j6tibMwoSee83zvkfXib11V6uFVbpjhWZS4icx7Q%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.9448818897637795" data-s="300,640" style="width: 180px;height: 170px;" data-type="png" data-w="254" src="https://wechat2rss.xlab.app/img-proxy/?k=74b55592&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icONvpnnVfZW5tdFQWVrGzXASAdZ7N3NoxaD7lf6j9E45EWLiaNVttr7Q%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">           </span></strong></span><strong><span style="font-size: 12px;text-align: justify;font-family: 宋体;">用户动态画像                         应用动态画像</span></strong></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">用户</span>/<span style="font-family: 宋体;">应用行为风险评估</span><span style="font-family: Calibri;">: </span></span></strong><span style="font-family: 宋体;">综合静态画像和动态画像完整了刻画用户实体，后续可基于画像数据进行</span><strong><span style="font-family: 宋体;">风险检测、风险分析、风险评估</span></strong><span style="font-family: 宋体;">等等；并以操作行为时间线及风险原因数据下钻举证的形式展现。</span></span></p><p><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p><img class="rich_pages js_insertlocalimg" data-ratio="0.7582417582417582" data-s="300,640" style="text-align: center;width: 187px;height: 142px;" data-type="png" data-w="273" src="https://wechat2rss.xlab.app/img-proxy/?k=1a1cbcb8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icks4YPcgiagI6eAMCfY85AHkuQK5ia6wFfAucU8vynyS12vxl4gfQJr1A%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.7666666666666667" data-s="300,640" style="text-align: center;width: 183px;height: 140px;" data-type="png" data-w="270" src="https://wechat2rss.xlab.app/img-proxy/?k=43b0100d&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icagPjxgxricybaWCIrvd1s6SLSQic3tBohjckMONreC5DBYUbohOQ1twQ%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">      </span></strong></span><span style="font-size: 12px;"><strong><span style="font-size: 12px;font-family: 宋体;"><span style="font-family: 宋体;">操作行为时间线</span>                       </span></strong><strong style="font-size: 16px;"><span style="font-size: 12px;font-family: 宋体;">风险评估原因举证</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">业务</span>/<span style="font-family: 宋体;">账号梳理</span><span style="font-family: Calibri;">:</span></span></strong><span style="font-family: 宋体;"> <span style="font-family: 宋体;">对客户的业务及账号进行梳理，直观展示应用系统业务接口和当前用户账号使用情况，列举</span></span><strong><span style="font-family: 宋体;">静默账号</span></strong><span style="font-family: 宋体;">等风险账号，梳理各接口访问及</span><strong><span style="font-family: 宋体;">失活接口</span></strong><span style="font-family: 宋体;">等风险状况，发现被安全运营人员忽视的业务接口，了解自身业务攻击面。</span></span></p><p><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;"><img class="rich_pages js_insertlocalimg" data-ratio="0.7627737226277372" data-s="300,640" style="width: 188px;height: 143px;" data-type="png" data-w="274" src="https://wechat2rss.xlab.app/img-proxy/?k=95c0edef&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icTaHXfncPTicGZt3n94ULLu1qicV6jM79OLf6Ke65O7xhxiaEYnZSeRdzw%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.7916666666666666" data-s="300,640" style="width: 181px;height: 143px;" data-type="png" data-w="264" src="https://wechat2rss.xlab.app/img-proxy/?k=d1dd4528&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icePgYNlNbIxdJVCGdniaoRo5ia8GF5wN4BYS860JgJDuHPuTqs2Yj7CHA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><span style="font-size: 16px;"><strong style="text-align: justify;"><span style="font-family: 宋体;">        </span></strong></span><span style="font-size: 12px;"><strong style="text-align: justify;"><span style="font-size: 12px;font-family: 宋体;"> 账号梳理                             </span></strong><strong style="text-align: justify;"><span style="font-size: 12px;font-family: 宋体;">账号详情</span></strong></span></p><p style="text-align: left;"><img class="rich_pages js_insertlocalimg" data-ratio="0.7670682730923695" data-s="300,640" style="text-align: center;width: 171px;height: 131px;" data-type="png" data-w="249" src="https://wechat2rss.xlab.app/img-proxy/?k=db8d3268&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6ic6JGODfLntRx9Q2ibicODNbm0by1A9sm0XGiagMa7QOscNtNqO3nxlCDfA%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-ratio="0.6597222222222222" data-s="300,640" style="text-align: center;width: 195px;height: 129px;" data-type="png" data-w="288" src="https://wechat2rss.xlab.app/img-proxy/?k=7b9cf799&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icCKCpPxX9z2rugbdIzY35ztqhLl26wpII3SGCvvHBm2JzU8YVc3XYww%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">         </span></strong></span><span style="font-size: 12px;"><strong><span style="font-size: 12px;font-family: 宋体;"><span style="font-size: 12px;font-family: 宋体;">业务梳理</span>                             <span style="font-size: 12px;font-family: 宋体;">业务详情</span></span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></strong></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">可配置的基线建模平台：</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">产品集成了可配置的行为基线建模平台用来进行行为基线建模，平台内置了</span>30+<span style="font-family: 宋体;">种特征提取转换函数、</span><span style="font-family: Calibri;">6</span><span style="font-family: 宋体;">种统计算子；</span><span style="font-family: Calibri;">7</span><span style="font-family: 宋体;">种行为基线建模算法；</span><span style="font-family: Calibri;">3</span><span style="font-family: 宋体;">种策略去误报方法；用户只需要通过</span></span><strong><span style="font-family: 宋体;">简单拖拽</span></strong><span style="font-family: 宋体;">的方式即可完成基线建模，</span><strong><span style="font-family: 宋体;">无需编写代码</span></strong><span style="font-family: 宋体;">。</span></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">可配置的基线建模平台的优点：</span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">①清晰明确的向客户展示基线建模过程中所使用的数据、特征、算法、策略等各个模块信息及整个基线建模的流程。</span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;">②开放基线建模能力给用户，直接拖拽不用编写代码即可快速完成基线建模。</span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><span style="font-family: 宋体;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="margin-top: 0px;margin-bottom: 0px;text-align: left;vertical-align: baseline;"><img class="rich_pages js_insertlocalimg" data-ratio="0.5932835820895522" data-s="300,640" style="text-align: center;width: 180px;height: 107px;" data-type="png" data-w="268" src="https://wechat2rss.xlab.app/img-proxy/?k=ecde2b58&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icxVxzzzA57ibck4aI0pzIC6fAW1uqB58PCfdvRcHjDXnKF5j3YbekAkw%2F640%3Fwx_fmt%3Dpng"/><img class="rich_pages js_insertlocalimg" data-s="300,640" style="text-align: center;width: 187px;height: 106px;" data-type="png" data-ratio="0.5649122807017544" data-w="285" src="https://wechat2rss.xlab.app/img-proxy/?k=0f9f917c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icpnBM40rmjdOlfvEpaHMP6ZAg74xWMlpflMRQWE9cJ8rv5GyrR9lzGQ%2F640%3Fwx_fmt%3Dpng"/></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">     </span></strong></span><span style="font-size: 12px;"><strong><span style="font-size: 12px;font-family: 宋体;"><span style="font-size: 12px;font-family: 宋体;">场景自定义</span>                            <span style="font-size: 12px;font-family: 宋体;">基线建模任务流</span></span></strong></span></p><p><br/></p><h1 style="text-align: center;"><span style="font-size: 20px;"><strong><span style="font-size: 20px;font-family: 宋体;"><span style="font-size: 20px;font-family: 宋体;">六、御见</span>UEBA<span style="font-size: 20px;font-family: 宋体;">典型场景</span></span></strong></span></h1><p><span style="font-size: 20px;"><strong><span style="font-size: 20px;font-family: 宋体;"><span style="font-size: 20px;font-family: 宋体;"><br/></span></span></strong></span></p><p><span style="font-family: 宋体;font-size: 16px;">御见UEBA内置了<span style="font-family: Calibri;">4</span>类<span style="font-family: Calibri;">20</span>多种典型场景以覆盖账号安全、办公安全、数据安全和业务安全，包括账号风险，离职员工权限风险，内部数据窃取，研发凭证外泄风险，研发数据泄漏风险，研发运维恶意操作等等。</span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">账号风险：</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">针对企业员工</span>VPN<span style="font-family: 宋体;">、</span><span style="font-family: Calibri;">OA</span><span style="font-family: 宋体;">等办公应用账号被攻击者窃取的风险监控。</span></span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">离职员工权限风险</span></strong><span style="font-family: 宋体;">：针对离职员工仍然具有权限，登录办公应用或业务系统的风险监控。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">内部数据窃取：</span></strong><span style="font-family: 宋体;"><span style="font-family: 宋体;">针对企业员工对内部</span>OA<span style="font-family: 宋体;">、</span><span style="font-family: Calibri;">HR</span><span style="font-family: 宋体;">等系统数据的异常访问和窃取风险监控。</span></span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><span style="font-family: 宋体;"><br/></span></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">研发凭证外泄风险：</span></strong><span style="font-family: 宋体;">针对研发运维账号外泄，存在外部异常登录行为的监控。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">研发数据泄漏风险：</span></strong><span style="font-family: 宋体;">针对内部源代码、数据库等研发数据泄漏风险的监控。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">研发运维恶意操作</span></strong><span style="font-family: 宋体;">：针对研发运维人员的高风险操作检测，以及异常行为预警。</span></span></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p><span style="font-family: 宋体;font-size: 16px;">典型场景示例：</span></p><p><br/></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;font-weight: bold;">1. </span><strong><span style="font-family: 宋体;">用户账号失陷检测</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">① 内部人员误点钓鱼邮件，泄露账号密码。</span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">② 黑客使用内部账号密码登录OA、营销、财经等多个内部系统，寻找有价值数据，找到数据后尝试大量下载。</span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">③ 御见UEBA通过对内部人员进行行为画像，建立安全基线，检测到多种行为异常，关联分析发现疑似内部人员账号失陷，及时告警。</span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">④ 安全运营人员及时联系员工确认，并封禁该员工权限。</span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">⑤ 安全运营人员借助应用安全中心对该账号行为进行审计，确认涉及的内部系统，查询其他内部系统监控记录，确认最终影响范围。</span></p><p style="text-indent: 28px;"><br/></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="1.54" data-s="300,640" style="" data-type="png" data-w="150" src="https://wechat2rss.xlab.app/img-proxy/?k=68098920&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6iclfJTsnyLicebCd9ENkn8dgLAkAsDQp1gofynUBCExo5DJHRqZt9Q4kA%2F640%3Fwx_fmt%3Dpng"/></p><p><br/></p><p><span style="font-size: 16px;"><span style="font-family: 宋体;font-weight: bold;">2. </span><strong><span style="font-family: 宋体;">应用数据泄露检测</span></strong></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;"><br/></span></strong></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.30707070707070705" data-s="300,640" style="" data-type="png" data-w="495" src="https://wechat2rss.xlab.app/img-proxy/?k=e3358a2e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavQBsRZjQqOmRZTqibib9Ucf6icgK8qia3BmERbLYSz3ev7FvXR315iaIkYMTaAPHZ6NgsEqQaWgzWlZPcA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><br/></p><p style="text-align: left;"><span style="text-indent: 28px;text-align: justify;font-family: 宋体;font-size: 16px;">① 应用出现逻辑漏洞。</span></p><p style="text-align: left;"><span style="text-indent: 28px;text-align: justify;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">② 黑客通过该暴露的漏洞，大量获取应用数据。</span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">③ 黑客为绕过访问频率限制，控制多个账号去尝试获取数据。</span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">④ 御见UEBA通过应用整体运行监控，发现应用访问量异常、访问用户量异常，同时发现部分用户访问行为异常，及时告警。</span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">⑤ 运营人员根据告警判断出现数据泄露，根据应用安全中心风险检测结果定位到风险接口，协助修复漏洞，防止进一步数据泄露。</span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-indent: 28px;font-family: 宋体;font-size: 16px;">⑥ 根据检测得到的多个黑客控制的风险账号的行为记录，以及应用的访问记录和数据访问记录，评估数据泄露规模，进行进一步总结整改。</span></p><p style="text-indent: 28px;text-align: left;"><br/></p><p><br/></p><p><span style="font-family: 宋体;font-size: 14px;">参考资料：</span></p><p><span style="font-family: 宋体;font-size: 14px;">2019Gartner, Market Guide for User and Entity Behavior Analytics</span></p><p><span style="font-family: 宋体;font-size: 14px;">2019Gartner, Market Trends: UEBA Providers Must Embrace Specialization</span></p><p><span style="font-family: 宋体;font-size: 14px;">2019Verizon, 2019 Data Breach Investigations report</span></p><p><span style="font-family: 宋体;font-size: 14px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="1" data-s="300,640" data-w="258" data-type="jpeg" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(53, 53, 53);letter-spacing: 0.544px;text-align: start;font-size: 15px;box-sizing: border-box !important;overflow-wrap: break-word !important;">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。欢迎关注~</span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br style="white-space: normal;"/></p><p><span style="font-family: 宋体;font-size: 14px;"><br/></span><br/></p>



<p><a href="2247484122">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=dfa80037&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484122%26idx%3D1%26sn%3D7efcfcca22973a091c4ae40d92b6c4b9%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 13 Jul 2020 12:37:00 +0800</pubDate>
    </item>
    <item>
      <title>可解释的机器学习</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484090&amp;idx=1&amp;sn=f4809e13f2b86ad1a06c2de05003cf56</link>
      <description>无论是对于使用机器学习服务的用户，还是研发机器学习模型的算法工程师，机器学习的可解释性都是十分重要的。对于用户而言，由于许多关键的系统、服务都逐渐开始使用机器学习技术</description>
      <content:encoded><![CDATA[<p>
原创 <span>aerio</span> <span>2020-06-22 12:00</span> <span style="display: inline-block;"></span>
</p>

<p>无论是对于使用机器学习服务的用户，还是研发机器学习模型的算法工程师，机器学习的可解释性都是十分重要的。对于用户而言，由于许多关键的系统、服务都逐渐开始使用机器学习技术</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=836ff337&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavTG4QQ2Pvy6QWZ4icpgrdcUPdqIn5VfPngiaSPaibccgGeDTbOGlo08bJsclQgiaUibLMLBpzDdzP3tU6w%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.6734375" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=5298de2e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTG4QQ2Pvy6QWZ4icpgrdcUPHvdmBXkr4WJB4PS3tf9ASwZ77gV4P7ia2ud5StAozgJnFe7rc0EG79w%2F640%3Fwx_fmt%3Dpng"/></p><p style="font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 17px;font-family: 宋体;"><br/></span></p><p style="font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 17px;font-family: 宋体;">写在前面：</span><span style="font-size: 17px;">  </span><br/></p><p style="font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 17px;"><br/></span></p><p style="font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">在腾讯安全的产品团队，随着产品的不断丰富，算法工程师面临越来越多的</span><span style="font-size: 16px;"></span><span style="font-size: 16px;font-family: 宋体;">算法解释性问题。例如我们做流量侧的异常检测，不仅要给出算法判定的异常流量对，还要给出异常指标、给出大盘数据分布情况、要能够拉出原始流量，还要给出友好的解释语言，例如</span><span style="font-size: 16px;">http</span><span style="font-size: 16px;font-family: 宋体;">流量中，某个通信对用了较多不常见的</span><span style="font-size: 16px;">UA</span><span style="font-size: 16px;font-family: 宋体;">，且一直返回失败</span><span style="font-size: 16px;"></span><span style="font-size: 16px;font-family: 宋体;">等。更复杂的情况，面对深度模型、集成模型等，我们也需要给用户提供有指导意义的、准确的样本解释。</span></p><p style="font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">起初在面对解释复杂模型的问题时，我曾一度认为这件事情是不可行的，起码不应该由工业界的人来做，因为当时理所当然的认为这是机器学习的理论研究范畴，而像深度模型的理论研究，众所周知的没有什么进展。而后，有一次跟别人讨论模型可解释性的问题，有同事简单介绍了模型无关的解释方法的思想，当时还认为</span><span style="font-size: 16px;">“</span><span style="font-size: 16px;font-family: 宋体;">模型无关的解释</span><span style="font-size: 16px;">”</span><span style="font-size: 16px;font-family: 宋体;">没有逻辑。但是后来，事实证明</span><span style="font-size: 16px;">“</span><span style="font-size: 16px;font-family: 宋体;">模型无关的解释</span><span style="font-size: 16px;">”</span><span style="font-size: 16px;font-family: 宋体;">完全可行，并且在一些产品中，该类解释方法更有实际价值。之后，为了扫除这个知识盲区，系统的了解了一下对这个问题的研究与成果，在这里尝试概括性的输出一下，正文如下：</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-family: 宋体;font-size: 18px;">引言：</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-family: 宋体;font-size: 18px;"><br/></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">无论是对于使用机器学习服务的用户，还是研发机器学习模型的算法工程师，机器学习的可解释性都是十分重要的。对于用户而言，由于许多关键的系统、服务都逐渐开始使用机器学习技术，例如人脸识别认证、信贷业务评审、视频内容审核、智能语音服务、智能医疗等，用户尤其是被</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">拒绝</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span><span style="font-size: 16px;font-family: 宋体;">的用户十分需要充足的理由来帮助他们理解自己为什么被拒绝。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">如果我认为我是一个良好公民，而某一天突然被高铁站的人脸识别拒绝而导致我乘不了高铁，并且不附带任何解释，那么无论如何都是不可接受的，这对整个社会来说都将会是个灾难。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span><span style="font-size: 16px;font-family: 宋体;">而对于算法工程师而言，理解模型更是一种基本素养，它可以帮助优化模型、控制模型，从而避免模型不可控的情况</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">在一些关键的服务中，模型不可控是非常可怕的</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span><span style="font-size: 16px;font-family: 宋体;">。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">本文主要基于</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“interpretable machine learning”</span><span style="font-size: 16px;font-family: 宋体;">的内容，结合实际的产品研发，做了新的梳理，希望能帮助机器学习在产品中的良好落地。本文将内容组织为：（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">1</span><span style="font-size: 16px;font-family: 宋体;">）确定解释的程度；（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">2</span><span style="font-size: 16px;font-family: 宋体;">）选用合适的解释方法；（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">3</span><span style="font-size: 16px;font-family: 宋体;">）具有代表性的解释方法；（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">4</span><span style="font-size: 16px;font-family: 宋体;">）解释中用到的可视化手段；四个主要部分。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-family: 宋体;font-size: 18px;">一、确定需要解释到哪种程度</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">      </span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">当要解释模型的时候，首先需要考虑的是对</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">谁</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span><span style="font-size: 16px;font-family: 宋体;">解释，解释什么问题。这个决定了我们需要对模型解释到哪种程度，也会很大程度上影响我们选用的解释方法。明显的，当我们面对关键的服务，例如银行、医疗、安防、交通等，与面对一般的服务，例如推荐、匹配等，其需要解释的程度是不一样的。关键服务对可解释性的要求较高，而一般服务则没有那么强。另外，当给算法工程师做模型解释服务时，需要在特征及特征交互、联合概率等极细粒度的尺度上去做，以保证严谨和灵活性。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-family: 宋体;font-size: 18px;">二、选用怎样的解释方法</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">       </span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">目前的模型解释方法已经有一些成果，不过他们在解释类别、解释效果、计算量等方面大有不同。在介绍具体的解释方法之前，首先总结现有的研究结论，将这些方法做一个分类梳理，如下：</span></p><table cellpadding="0"><tbody><tr><td width="186" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">分类依据</span></p></td><td width="183" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">类别</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">1</span></p></td><td width="183" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">类别</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">2</span></p></td></tr><tr><td width="186" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">1</span><span style="font-size: 16px;font-family: 宋体;">）是否本质上可解释</span></p></td><td width="183" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">本质上可解释</span></p></td><td width="183" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">本质上难解释（事后解释）</span></p></td></tr><tr><td width="186" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">2</span><span style="font-size: 16px;font-family: 宋体;">）是否针对特定模型</span></p></td><td width="183" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">基于特定模型的解释</span></p></td><td width="183" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">模型无关的解释</span></p></td></tr><tr><td width="186" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">3</span><span style="font-size: 16px;font-family: 宋体;">）是否针对全局样本</span></p></td><td width="183" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">针对局部样本的解释</span></p></td><td width="183" style="padding: 1px;"><p style="text-align: left;"><span style="font-size: 16px;font-family: 宋体;">全局样本的解释</span></p></td></tr></tbody></table><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;">（</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">1</span><span style="font-size: 17px;font-family: 宋体;">）本质上是否可解释：</span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;"><br/></span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;font-family: 宋体;">A:本质上可解释：</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">       </span><span style="font-size: 16px;font-family: 宋体;">它指的是在应用中，由于使用了结构简单、容易理解和分解的模型，而使得对结果的解释可以基于模型本身的结构构成、计算逻辑进行解释。例如线性模型一类方法的预测结果可以简单视为多个特征的加权和，而树模型一类的方法可以视为多条规则的组合等。在实际中，如果对模型可解释性要求比较高，则可以直接选用较为简单的模型进行开发。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;font-family: 宋体;">B:本质上难解释（事后解释）：</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">       </span><span style="font-size: 16px;font-family: 宋体;">由于模型复杂度和模型能力是息息相关，所以实际应用中，为了得到更好的性能，我们很多情况下不得不用一些复杂的模型，这也导致了模型结果缺乏可解释性。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">       </span><span style="font-size: 16px;font-family: 宋体;">事后解释指的是针对这些较复杂的、本质上不可解释的模型，例如深度模型、广义非线性模型等，进行样本解释的一类方法。它的思路是，既然原模型不可解释，那就先忽略掉原模型，仅仅基于它的输出，进行基于样本或利用代理模型进行解释。由于实际中大部分的模型都是难解释的模型，因为该类方法也是使用的最为广泛的一类方法。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;">（</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">2</span><span style="font-size: 17px;font-family: 宋体;">）是否是针对特定模型的解释：</span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;"><br/></span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;font-family: 宋体;">A:基于特定模型的解释：</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">       </span><span style="font-size: 16px;font-family: 宋体;">它指的是针对某种特定类型的模型进行解释，从而针对性的解决特定模型输出结果的解释方法，该模型一般适用于本质上可解释的模型，并且通用性较低。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"><span style="font-family:-webkit-standard, serif;">B:</span></span><span style="font-size: 16px;font-family: 宋体;">模型无关的解释：</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">       </span><span style="font-size: 16px;font-family: 宋体;">它指的是不管训练过程用了哪种模型，都可以对结果进行解释，与事后解释的方法类似，使用的较为广泛。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;">（</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">3</span><span style="font-size: 17px;font-family: 宋体;">）是否支持对全局样本的解释：</span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;"><br/></span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;font-family: 宋体;">A:针对局部样本的解释：</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">       </span><span style="font-size: 16px;font-family: 宋体;">它指的是针对某些样本，进行单独的解释，该类方法一般会依赖目标样本及其邻域进行解释，例如利用代理模型、数据原型等方法解释目标样本，但该类方法由于仅仅依赖部分样本，也导致它不能通用到每一个样本身上，需要对每一个样本进行单独的解释训练。如经典的</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">LIME</span><span style="font-size: 16px;font-family: 宋体;">方法就是针对局部样本的解释。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;font-family: 宋体;">B:全局样本的解释：</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">       </span><span style="font-size: 16px;font-family: 宋体;">该类解释方法能够适用于面对的所有样本，具有通用性。本质上可解释的模型，一般可以进行全局样本的解释。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">（之前理解固执的认为解释模型只能从本质上进行解释才叫解释，经过了解之后，发现模型无关的解释才比较值得期待。之前可能还是太算法思维了。）</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-family: 宋体;font-size: 18px;">三、具有代表性的解释方法</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-family: 宋体;font-size: 18px;"><br/></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">        </span><span style="font-size: 16px;font-family: 宋体;">以下简单介绍下几种代表性的解释方法的核心思想，不涉及细节。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;">（</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">1</span><span style="font-size: 17px;font-family: 宋体;">）针对线性模型的解释</span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;"> </span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">这里指的线性模型是</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">g=f(a0+a1*x1+a2*x2+...+a9*x9)</span><span style="font-size: 16px;font-family: 宋体;">，其中</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">f</span><span style="font-size: 16px;font-family: 宋体;">为一个单调映射函数。特别的，当</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">f</span><span style="font-size: 16px;font-family: 宋体;">为</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">x-</span><span style="font-size: 16px;font-family: 宋体;">》</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">x</span><span style="font-size: 16px;font-family: 宋体;">的映射时，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">g</span><span style="font-size: 16px;font-family: 宋体;">是一个线性回归模型，而</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">f</span><span style="font-size: 16px;font-family: 宋体;">是一个概率映射时，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">g</span><span style="font-size: 16px;font-family: 宋体;">是一个逻辑回归模型。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">由于线性模型具有</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">输出与特征的加权和相关</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span><span style="font-size: 16px;font-family: 宋体;">的特点，所以线性模型中可以很方便的拆解各个特征。针对线性模型，一种普遍的研究思路是</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">将单独一个特征的取值增加一个单位，而保持其他特征的取值不变，以观察输出的变化</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span><span style="font-size: 16px;font-family: 宋体;">。类似于一个偏导的概念。该偏导数能够说明某个特征对输出的影响，从而解释样本。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">但线性模型也有问题，它要求</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">单独增加一个特征的值，而保持其他的特征取值不变</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span><span style="font-size: 16px;font-family: 宋体;">，这个要求会使得产生一些不合理的数据样本，从而使得解释具有一定的偏差。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;">（</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">2</span><span style="font-size: 17px;font-family: 宋体;">）树模型</span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;"><br/></span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">树模型的工作模式为根据特征的取值进行样本划分，最后使得每个区域的样本满足截止条件。树模型的工作模式比较简单，因此针对树模型的解释只需要简单的将样本划分过程可视化出来即可得到不错的效果。（线性模型和树模型常用作其他黑盒的代理模型）</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;">（</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">3</span><span style="font-size: 17px;font-family: 宋体;">）反事实解释</span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">反事实解释的表述模式为</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">如果发生</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X</span><span style="font-size: 16px;font-family: 宋体;">，那么</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Y</span><span style="font-size: 16px;font-family: 宋体;">就会发生。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span><span style="font-size: 16px;font-family: 宋体;">它寻找到</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Y</span><span style="font-size: 16px;font-family: 宋体;">结果的边界，并基于已有的数据样本，做最小的特征改动，越过边界，以生成反事实来进行解释，并且为了解释的效果，通常会选择一些符合常识、明显的特征生成反事实。例如解释银行贷款的场景时，可以使用该解释方式，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">如果小明年龄大于</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">25</span><span style="font-size: 16px;font-family: 宋体;">岁，那么他会申请到贷款。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span><span style="font-size: 16px;font-family: 宋体;">反事实解释比较重视样本间的对比性，解释通俗易懂，比较友好。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;">（</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">4</span><span style="font-size: 17px;font-family: 宋体;">）原型与批判</span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">原型解释是面向算法工程师的一种解释方法，它能够帮助算法工程师了解数据分布。它的思路是在密度较高的区域寻找到原型，距离原型较远的数据点为批判。由此可见，原型与批判是一种基于密度的方法，它将质心当作原型，离群点当作批判。将该思路用到可解释性上时，算法工程师可以直接将原型和批判样本点分别打印出来，以理解数据分布。例如在做性别分类的时候，查看原型是否分别是两个性别的代表，而批判则可以帮助算法工程师理解，是什么样的</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">badcase</span><span style="font-size: 16px;font-family: 宋体;">。（数据分布本身就是决定机器学习性能的因素，因此基于原型与批判的方法虽然看上去不是直接解释模型的方法，但实际却是很实用的方法，因为直接把正例和反例拉出来做对比很直观）</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;">（</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">5</span><span style="font-size: 17px;font-family: 宋体;">）基于相似度的解释</span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">推荐系统中经常使用该类方法做推荐解释，例如购买</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">A</span><span style="font-size: 16px;font-family: 宋体;">的人也购买了</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">B</span><span style="font-size: 16px;font-family: 宋体;">，你的朋友小明点评了这个电影等。基于相似度的解释是非常友好的一类方法，但它比较依赖用户对参照实体的理解，例如假如没有朋友小明，就无法根据参照物做出解释。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;">（</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">6</span><span style="font-size: 17px;font-family: 宋体;">）</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">LIME</span><span style="font-size: 17px;font-family: 宋体;">方法</span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;"> LIME</span><span style="font-size: 16px;font-family: 宋体;">是一种基于模型代理的局部样本解释方法，思路是针对要解释的样本点，重新在样本点处建立一个本质上可解释的模型。在建立代理模型的时候，使用的是原模型的输入和输出，将待解释样本点附近的点赋予较大的权重，并将拟合原模型的输出作为代理模型的优化目标。得到代理模型之后，再基于代理模型进行样本的解释。需要注意的是，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">LIME</span><span style="font-size: 16px;font-family: 宋体;">方法是基于特定样本的解释，这意味着，在某个样本点训练的代理模型，不能使用到其他样本点上。对于所有待解释的样本，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">LIME</span><span style="font-size: 16px;font-family: 宋体;">方法都需要重新训练代理模型，这在实际中导致了较大的计算量。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><span style="font-size: 17px;font-family: 宋体;">（</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">7</span><span style="font-size: 17px;font-family: 宋体;">）</span><span style="font-size: 17px;font-family: -webkit-standard, serif;">Shapley</span><span style="font-size: 17px;font-family: 宋体;">值</span></span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">Shapley</span><span style="font-size: 16px;font-family: 宋体;">值是另一种比较经典的解释方法，并且它是唯一具有扎实理论的解释方法。它使用全部的特征作为输入，并将特征之间的所有可能组合作为联盟。一个联盟指的是特征之间的一种组合。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Shapley</span><span style="font-size: 16px;font-family: 宋体;">值指的是所有可能的联盟中特征值的平均边际贡献。对于这些联盟中的每个联盟，我们都计算带有或不带有某个特征取值的预测值，并取其差值，以获得边际贡献。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Shapley</span><span style="font-size: 16px;font-family: 宋体;">值是边际贡献的（加权）平均值。例如，如果用</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X1,X2,X3,X4</span><span style="font-size: 16px;font-family: 宋体;">共同预测</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Y</span><span style="font-size: 16px;font-family: 宋体;">。某个样本的观测为</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X1=0,X2=2,X3=0,X4=1, </span><span style="font-size: 16px;font-family: 宋体;">针对这个样本，度量</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X1=0</span><span style="font-size: 16px;font-family: 宋体;">对于预测的贡献</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Shapley</span><span style="font-size: 16px;font-family: 宋体;">值，（假设</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X1</span><span style="font-size: 16px;font-family: 宋体;">是一个二分类特征，取值</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">0/1</span><span style="font-size: 16px;font-family: 宋体;">）。首先利用</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X2, X3, X4</span><span style="font-size: 16px;font-family: 宋体;">得到【</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">‘’</span><span style="font-size: 16px;font-family: 宋体;">，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">‘X2=2’</span><span style="font-size: 16px;font-family: 宋体;">，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">‘X3=0’</span><span style="font-size: 16px;font-family: 宋体;">，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">‘X4=1’</span><span style="font-size: 16px;font-family: 宋体;">，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">‘X2=2 ,X3=0’, ‘X2=2 ,X4=1’,’ X3 =0,X4=1’, ‘X2=2 ,X3=0,X4=1’</span><span style="font-size: 16px;font-family: 宋体;">】的联盟，然后针对每一个联盟，将</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X1</span><span style="font-size: 16px;font-family: 宋体;">的取值替换（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X1=1</span><span style="font-size: 16px;font-family: 宋体;">），计算预测值</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Y</span><span style="font-size: 16px;font-family: 宋体;">，并与将忽略</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X1(X1=0</span><span style="font-size: 16px;font-family: 宋体;">或</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X1=1</span><span style="font-size: 16px;font-family: 宋体;">，类似于边缘概率的概念</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">)</span><span style="font-size: 16px;font-family: 宋体;">特征值时，联盟的预测值取差值，将该差值当作边际贡献。最终</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">X1</span><span style="font-size: 16px;font-family: 宋体;">某个特征值的贡献为所有边际贡献的加权平均值。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Shapley</span><span style="font-size: 16px;font-family: 宋体;">值可以估计某个特征的取值对预测的贡献大小，并且在估计的过程中，考虑到了特征之间可能的交互。缺点是，计算量可能会略大，尤其是特征维度较高的时候。不过，现在有一种</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">TreeSHAP</span><span style="font-size: 16px;font-family: 宋体;">方法，它可以计算精确的</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Shapley</span><span style="font-size: 16px;font-family: 宋体;">值，并且速度很快。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-family: 宋体;font-size: 18px;">四、解释中用到的可视化手段</span></strong></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">以下列举了部分具有代表性的可视化手段，用于专业的模型解释可视化。个人觉得很有参考价值，但不太适用于面对普通用户的解释，门槛比较高。针对用户的解释，还是要尽量接地气，如一辆自动驾驶汽车，报告其</span><span style="font-size: 16px;font-family: 宋体;">突然停车的原因</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">(“</span><span style="font-size: 16px;font-family: 宋体;">孩子越过马路的概率为</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">70%”);</span><span style="font-size: 16px;font-family: 宋体;">信用违约程序，向银行员工解释为何拒绝信用申</span><span style="font-size: 16px;font-family: 宋体;">请</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">(“</span><span style="font-size: 16px;font-family: 宋体;">申请人的信用卡过多，并且从事不稳定的工作。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”);</span><span style="font-size: 16px;font-family: 宋体;">一个机械臂，解释了为什么它把物品从传</span><span style="font-size: 16px;font-family: 宋体;">送带上搬到垃圾桶里</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">(“</span><span style="font-size: 16px;font-family: 宋体;">物品底部有裂缝。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”)</span><span style="font-size: 16px;font-family: 宋体;">。</span></p><p style="text-align: left;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="margin-top: auto;margin-bottom: auto;text-align: left;"><strong><span style="font-size:16px;font-family:-webkit-standard,serif;color:black;">（1）<span style="font-stretch: normal;font-size: 9px;line-height: normal;">  </span></span><span style="font-size: 16px;font-family: -webkit-standard, serif;color: black;">SHAP</span><span style="font-size: 16px;font-family: 宋体;color: black;">解释力图</span></strong><span style="font-size: 16px;font-family: 宋体;color: black;">：针对单个样本的解释，蓝色表示增加效应，红色表示减少效应，长条的长短表示</span><span style="font-size: 16px;font-family: -webkit-standard, serif;color: black;">Shapley</span><span style="font-size: 16px;font-family: 宋体;color: black;">值。</span></p><p style="margin-top: auto;margin-bottom: auto;text-align: left;"><span style="font-size: 16px;font-family: 宋体;color: black;"><img data-ratio="0.163855421686747" data-w="830" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=437fd1b5&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTG4QQ2Pvy6QWZ4icpgrdcUPicxpytGUM8ia4Nx0WAREiaw4MEoicyJGsIUic00Iic1vAbtg7axtw6XECJ5w%2F640%3Fwx_fmt%3Dpng"/></span></p><p style="margin-top: auto;margin-bottom: auto;text-align: left;"><span style="font-size: 16px;font-family: 宋体;color: black;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;font-family: 宋体;">（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">2</span><span style="font-size: 16px;font-family: 宋体;">）特征重要性可视化</span></strong><span style="font-size: 16px;font-family: 宋体;">：特征重要性可以由多种特征重要性计算方法得到。</span></p><p><img data-ratio="0.6409638554216868" data-w="830" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=24cf19ff&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTG4QQ2Pvy6QWZ4icpgrdcUPuiaGq0674CDj9PZwaVrcvnkREgic85iaT9JiaXGZwoZlmFibwxbDjBibaRNA%2F640%3Fwx_fmt%3Dpng"/></p><p><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;font-family: 宋体;">（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">3</span><span style="font-size: 16px;font-family: 宋体;">）特征概要图</span></strong><span style="font-size: 16px;font-family: 宋体;">：如下图，图中每个点为一个样本，点的颜色和位置与</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Shapley</span><span style="font-size: 16px;font-family: 宋体;">解释力图类似。</span></p><p><img data-ratio="0.672289156626506" data-w="830" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=0bf62cee&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTG4QQ2Pvy6QWZ4icpgrdcUPJwoa6OMdnbaj0AicnCvclBC3ubVuDvdsc5Br2uAeMlu7rBzWs1omYoA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;font-family: 宋体;">（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">4</span><span style="font-size: 16px;font-family: 宋体;">）</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">SHAP</span><span style="font-size: 16px;font-family: 宋体;">特征依赖图</span></strong><span style="font-size: 16px;font-family: 宋体;">：横轴是特征取值，纵轴为</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Shapley</span><span style="font-size: 16px;font-family: 宋体;">值。是将特征概要图中某个特征拉出来展示。</span></p><p><img data-ratio="0.6409638554216868" data-w="830" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=4b6583bb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTG4QQ2Pvy6QWZ4icpgrdcUPVXoQKzs6jusSPrlXwYUuWBOvfFrpPNmCrxeN5M9lmw3XAXNU3ujkLg%2F640%3Fwx_fmt%3Dpng"/></p><p><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;font-family: 宋体;">（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">5</span><span style="font-size: 16px;font-family: 宋体;">）个体条件期望</span></strong><span style="font-size: 16px;font-family: 宋体;">（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">ICE</span><span style="font-size: 16px;font-family: 宋体;">，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Individual Conditional Expectation</span><span style="font-size: 16px;font-family: 宋体;">）图：横轴是特征取值，纵轴。每个实例显示一条线，该线显示了特征更改时实例的预测如何改变。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><img data-ratio="0.6987951807228916" data-w="830" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=327ba7dc&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTG4QQ2Pvy6QWZ4icpgrdcUPQrI5vibUj4vhsKSMQ5pjTgUqE2WGpibGQul3Gu5DAZMhD6UUsRmkZw2A%2F640%3Fwx_fmt%3Dpng"/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;font-family: 宋体;">（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">6</span><span style="font-size: 16px;font-family: 宋体;">）局部累积效应图</span></strong><span style="font-size: 16px;font-family: 宋体;">（</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">ALE</span><span style="font-size: 16px;font-family: 宋体;">，</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">Accumulated Local Effects Plot</span><span style="font-size: 16px;font-family: 宋体;">）图：下图为一个二阶局部累积效应图，它能够展示具有强相关性的两个变量对目标的联合效应。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"></span><img data-ratio="0.7180722891566265" data-w="830" data-type="png" src="https://wechat2rss.xlab.app/img-proxy/?k=99570656&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTG4QQ2Pvy6QWZ4icpgrdcUPGibaicM6j7JHgoPBON1f6B6eO9Cia4dgSstiaOJJuicRRicQiahCPJsJngZWg%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;"> </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 18px;"><span style="font-size: 18px;font-family: 宋体;">结语：</span><span style="font-size: 18px;font-family: -webkit-standard, serif;">       </span></span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;"> </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">解释模型这个问题，考虑好面对谁解释真的挺重要。之前偏执的认为就应该从本质上解释，就是因为没考虑到</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">面对的受众需不需要我这么严谨的去跟他解释</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span><span style="font-size: 16px;font-family: 宋体;">。这个问题的回答，大部分都应该是否定的吧。因此，产品中，完全可以把它当成一个产品问题解决掉。但抛开面对普通用户的解释，面对我们算法工程师自己，可能我们需要往数据探索上做，去可视化特征及特征之间的交互效应，有点像探索模型边界，让它变的可控，不过这个暂时还没有那么多精力，只能闲时学习了。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;">最后摘抄两段话分享出来，表达对这个方向的期待吧：</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: 宋体;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;"> “</span><span style="font-size: 16px;font-family: 宋体;">当它与底层的机器学习模型分离时，使可解释性自动化变得容易得多。与模型无关的可解释性的优点在于其模块化。我们可以轻松地替换底层的机器学习模型。我们可以轻松地替换解释方法。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;caret-color: rgb(0, 0, 0);color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;font-family: -webkit-standard, serif;">“</span><span style="font-size: 16px;font-family: 宋体;">模型训练的自动化已经是一个显而易见的趋势。这包括自动工程和特征选择，自动超参数优化，不同模型的比较以及模型的集成或堆叠。结果是最佳可能的预测模型。当我们使用与模型无关的解释方法时，我们可以将它们自动应用于自动机器学习过程中出现的任何模型。在某种程度上，我们也可以使第二步自动化</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">:</span><span style="font-size: 16px;font-family: 宋体;">自动计算特征重要性、绘制部分依赖关系、训练代理模型等等。没有人会阻止你自动计算所有这些模型解释。实际的解释仍然需要人类。想象一下</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">:</span><span style="font-size: 16px;font-family: 宋体;">你上传了一个数据集，指定了预测目标，并且只需按一下按钮，就可以训练出最佳的预测模型，并且程序会吐出对该模型的所有解释。</span><span style="font-size: 16px;font-family: -webkit-standard, serif;">”</span></p><p><br/></p>



<p><a href="2247484090">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=daf6930c&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484090%26idx%3D1%26sn%3Df4809e13f2b86ad1a06c2de05003cf56%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 22 Jun 2020 12:00:00 +0800</pubDate>
    </item>
    <item>
      <title>基于流量日志的SQL注入分析技巧</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484068&amp;idx=1&amp;sn=1da8170074a662b1e57b6c3009f576f4</link>
      <description>作为一名安全运营人员，每天总会处理各种各样的安全事件/告警，而其中最为常见的莫过于SQL注入告警。而面对SQL注入告警时最重要的就是确定是否注入成功。本文简单归纳总结如何通过流量日志快速判断SQL注入是否成功。</description>
      <content:encoded><![CDATA[<p>
原创 <span>梁广鹏</span> <span>2020-06-15 12:00</span> <span style="display: inline-block;"></span>
</p>

<p>作为一名安全运营人员，每天总会处理各种各样的安全事件/告警，而其中最为常见的莫过于SQL注入告警。而面对SQL注入告警时最重要的就是确定是否注入成功。本文简单归纳总结如何通过流量日志快速判断SQL注入是否成功。</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=21f120e0&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZy3x5kO2r3oqQBqWswPsfU48Yw960nnQibqef6SGialTSn9I2sFsmdy1tA%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">导语</span></strong><span style="font-size: 16px;">  作为一名安全运营人员，每天总会处理各种各样的安全事件/告警，而其中最为常见的莫过于SQL注入告警。而面对SQL注入告警时最重要的就是确定是否注入成功，但不同类型的SQL注入确定的方法又不一样，有些是通过一个请求就可以确定是否注入成功而有些则需要观察多个请求后才能确定是否成功。而本文则是简单归纳总结如何通过流量日志快速判断SQL注入是否成功。</span></p><p><br/></p><p><strong><span style="font-size: 16px;">文章大纲</span></strong><span style="font-size: 16px;"></span></p><p><strong><span style="font-size: 16px;"><br/></span></strong></p><ul class="list-paddingleft-2" style="list-style-type: disc;"><li style="font-size: 16px;"><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">不同数据库的区别</span></p></li><li style="font-size: 16px;"><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">常见SQL注入方式</span></p></li><ul class="list-paddingleft-2" style="list-style-type: square;"><li style="font-size: 16px;"><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);"><span style="font-size: 16px;">布尔类型注入</span></p></li><li style="font-size: 16px;"><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);"><span style="font-size: 16px;">错误类型注入</span></p></li><li style="font-size: 16px;"><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);"><span style="font-size: 16px;">联合类型注入</span></p></li><li style="font-size: 16px;"><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);"><span style="font-size: 16px;">堆叠类型注入</span></p></li><li style="font-size: 16px;"><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);"><span style="font-size: 16px;">时间类型注入</span></p></li></ul><li style="font-size: 16px;"><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">总结</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span></p></li></ul><hr style="border-style: solid;border-width: 1px 0px 0px;border-color: rgba(0, 0, 0, 0.1);transform-origin: 0px 0px;transform: scale(1, 0.5);"/><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-align: center;"><span style="font-size: 20px;"><strong><span style="font-size: 20px;color: rgb(51, 51, 51);font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">一、不同数据库的区别</span></strong></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-align: center;"><span style="color: rgb(51, 51, 51);font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 16px;text-align: start;"><br/></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-align: left;"><span style="color: rgb(51, 51, 51);font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 16px;text-align: start;">这里主要关注的是在SQL注入上的差别，而不是功</span><span style="color: rgb(51, 51, 51);font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 16px;text-align: start;">能、性能上的差别。</span><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong style="font-size: 16px;"><br/></strong></p><p><span style="font-size: 16px;"><strong>1.字符上的区别</strong></span></p><p><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">不同数据库对于同一个字符都可能有不同的含义和处理方式，因此同样的注入payload在不同数据中会有不一样的表现形式。</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">下面简单举例：</span><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"> “+”号：</span><span style="font-size: 16px;">在MSSQL中，“+”号代表字符串拼接，因此“a+b”的结果是“ab”.</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">空格：</span><span style="font-size: 16px;">  在MySQL中，空格代表字符串拼接，因此“a b”的结果是“ab”.</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">“||”号：</span><span style="font-size: 16px;">  在Oracle中，“||”号代表字符串拼接，因此“a||b”的结果是“ab”.</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">以MySQL数据库为例，演示“+”号和空格拼接字符串的区别：</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span><img class="rich_pages js_insertlocalimg" data-ratio="0.6395759717314488" data-s="300,640" style="text-align: center;color: rgb(51, 51, 51);font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;" data-type="png" data-w="1132" src="https://wechat2rss.xlab.app/img-proxy/?k=1dd5ed98&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZyDuGlt7K7dNyOCKXYNck0nuKibHEbwXOV4KcfBjLYIvMAysMzbqnCo5A%2F640%3Fwx_fmt%3Dpng"/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;">2.函数上的区别</span></strong></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 17px;"><br/></span></strong></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span><span style="font-size: 16px;">对于</span><span style="font-size: 16px;">同一个功能，不同的数据库中的函数名可能不一样。</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;text-align: left;">以时间函数为例，</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">        </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">在MySQL中的函数名为“sleep()”，</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">        </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">在MSSQL中则是使用语句的形式“waitfor <span style="color: rgb(51, 51, 51);background: white;">{Delay &#39;time&#39;|Time &#39;time&#39;}</span>”,</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">        </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">而Oracle中则是使用“DBMS_LOCK.SLEEP()”</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">       </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">以MySQL和MSSQL为例，演示两者不同的区别（时间延迟）：<br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">       </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">MySQL中，使用“sleep”函数：<br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">        </span></p><p style="text-align: left;"><img class="rich_pages js_insertlocalimg" data-ratio="0.9944903581267218" data-s="300,640" style="" data-type="png" data-w="726" src="https://wechat2rss.xlab.app/img-proxy/?k=250e6b2c&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZy0LicW3R6OzziaeIcibYeMR3GdSdfvG1P714llHvyEx2SrVe6rqRfkqmSA%2F640%3Fwx_fmt%3Dpng"/><span style="font-size: 16px;text-align: left;"> MSSQL中，使用“waitfor delay”</span></p><p style="text-align: left;"><span style="font-size: 16px;">    </span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.6863468634686347" data-s="300,640" style="" data-type="png" data-w="271" src="https://wechat2rss.xlab.app/img-proxy/?k=ebca5339&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZyjMokDpj4dNWbSn5DYbZXggZvI5zyQpibN444gwfCicE2icefZdQZe0XDA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">3. 结构特点上的区别</span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"><br/></span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">不同的数据库在设计上总会有着自己的特点，而这些特点往往会被攻击者用于进行注入或者更进一步的攻击。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><ul class="list-paddingleft-2" style="list-style-type: square;"><li><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">MySQL-Information库</span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong><span style="font-size: 16px;"></span></p></li></ul><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">在MySQL数据库中，最具有特色的莫过于Information库了，因为这个库中保存了大量的敏感数据，小至字段名、表名和数据库名，上至敏感配置和用户密码你都能在其中找到。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">        <br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"> 通过information库获取已有表名：</span></p><p style="text-align: left;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.571875" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=214450c8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZytNpvY97AUQIyOnylicxv5SICF86RPqmtQuKht2adwHMfO9Aj77ejqicw%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><ul class="list-paddingleft-2" style="list-style-type: square;"><li style="font-size: 16px;font-weight: bold;"><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">MSSQL-xp_cmdshell</span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span></p></li></ul><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">每当提起MSSQL时就不得不提xp_cmdshell，因为通过它可以在系统上执行任意系统命令。虽然在后来的版本中被默认关闭，总可以通过各种手段进行开启。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">    <br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">开启前后对比：</span><strong><span style="font-size: 16px;"><br/></span></strong></p><p style="text-align: left;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: left;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">开启前：</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">    </span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.54765625" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=5fd339b3&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZy9obfuFIMQAEV1Fu1AORKzgjdKdiaia8CQKUIh7fsMqaUCofR4nxpc4EA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><span style="font-size: 16px;"> </span></p><p style="text-align: left;"><span style="font-size: 16px;">开启后：<br/></span></p><p style="text-align: left;"><span style="font-size: 16px;">        </span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.53828125" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=f2d8a80b&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZy2FI72slQ3VqmOg2pw0joyTzUtkx2wvxEcylHAqkwvcQ64gHvq3vbbw%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><br/></p><ul class="list-paddingleft-2" style="list-style-type: square;"><li style="font-size: 16px;font-weight: bold;"><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">oracle-漏洞</span></strong><span style="font-size: 16px;"></span></p></li></ul><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">       </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">在众多数据库中，oracle对于权限的管理是最为严格的，因此攻击者在对oracle数据库进行注入时往往需要进行提权操作。而oracle数据库本身的设计是较为完善的，所以往往需要利用数据库本身的漏洞进行提权。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">已有的oracle漏洞</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.2671875" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=3d08d502&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZyANqMsUXCwTxKn7GCxSLvd3qyyOibQ4nGEFzloK2B25pq7NEFaP8enNQ%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">        <br/></span></p><hr style="border-style: solid;border-width: 1px 0px 0px;border-color: rgba(0, 0, 0, 0.1);transform-origin: 0px 0px;transform: scale(1, 0.5);"/><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-align: center;"><span style="font-size: 20px;"><strong><span style="font-size: 20px;color: rgb(51, 51, 51);font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;">二、常见SQL注入方式</span></strong></span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-align: center;"><span style="font-size: 20px;"><strong><span style="font-size: 20px;color: rgb(51, 51, 51);font-family: mp-quote, -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;"><br/></span></strong></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">SQL注入有多种不同类型的注入方式，最为简单的分类就是根据有无回显来进行分类。但实际中为了能够更加高效的对SQL事件/告警进行确认，因此我们需要更加细分。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><ul class="list-paddingleft-2" style="list-style-type: disc;"><li style="font-size: 16px;font-weight: bold;"><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">布尔类型注入</span></strong></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong><span style="font-size: 16px;"></span></p></li></ul><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"> 该类型的注入主要依赖于表达式、函数或查询的结果是否正确从而影响页面输出结果来判断是否存在注入。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">简单举例说明，下面假设对参数id（数值类型）进行攻击，后端数据库是mysql：</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><strong>表达式类型：</strong></span><span style="font-size: 16px;">?id=1 and 0</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">    </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">从运算符上分析，1和0做and运算的结果是0，此时数据库应该查询id为0的结果。但对于后端处理逻辑而言“ and 0”这部分数据理应是无效的（正确过滤情况下），因此应该查询id为1的结果。此时攻击者只要通过判断页面显示id为1还是id为0的结果就可以初步判断这里是否存在注入点。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">函数类型：</span></strong><span style="font-size: 16px;"> ?id=1 and length(username()&gt;5)</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">从上面给出的payload可以看出，当攻击者需要进一步获取信息时往往会用到数据库中内置的函数（或通过查询语句获取）。然后通过预先设置好的条件来控制页面的输出结果。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">    </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">从流量日志上进行可以发现该注入方法除了攻击payload中出现相关表达式/函数以外，更重要的一个特点是会对同一个注入点出现多次且次数较为稳定的尝试。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">为什么会同一个注入点会出现多次尝试？</span></strong><span style="font-size: 16px;"></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">这是因为攻击者在对某些信息做枚举尝试。前面说了，该方法只会影响页面的输出结果而不会直接显示想要获取的结果，因此需要做大量尝试才能确定结果。攻击者在这种情况下需要进行两个阶段的循环尝试：</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">    </span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">循环一：确定要获取数据的长度。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">循环二：确定要获取数据的值。</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">  </span><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">为什么次数较为稳定？</span></strong><span style="font-size: 16px;"></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">这里的次数是指循环二中的尝试次数，正常情况下数据库中的保存值（如数据库名、表名、字段名或其他敏感信息）都是特定字符范围的，最为常见的就是a-zA-Z0-9加一点常见的标点符号。因此对于攻击者而言只需要遍历一次对应位置的常见字符就能确定该位置的具体值。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">过程举例</span></strong><span style="font-size: 16px;"><br/></span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">    <br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.4974974974974975" data-s="300,640" style="width: 578px;height: auto;" data-type="png" data-w="999" src="https://wechat2rss.xlab.app/img-proxy/?k=0c3a6a07&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZyRahhllicdicZLmr6tZnyNQfqVo4gvjdJib3K4PEJwbQ79PTrhzswAIueA%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><ul class="list-paddingleft-2" style="list-style-type: disc;"><li style="font-size: 16px;font-weight: bold;"><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">错误类型注入</span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong></p></li></ul><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">出现错误类型注入时往往是攻击者最开心的，因为该方法利用成本低无需大量的尝试，同时能够在返回的数据中看到想要的结果。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">该方法在流量日志中进行确认时需要把重心放在返回的数据包中，但一般情况下数据往往是通过十六进制进行保存的，因此无法直接关键词搜索需要先进行解码。在解码后需要确定攻击者所要获取的数据是否出现在返回数据包中。一般情况下所获取的数据往往会被对应数据库的错误信息而包围，因此一旦在返回的数据包中出现数据库的错误信息则很大可能情况是被攻击成功的。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">错误信息中包含攻击者要获取的信息：</span></p><p style="text-align: left;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.1015625" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=1943cdf5&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZybvxLIsZ4AsWicKLNBzek7tHcCbibsDHAiabaaIrjxCDLu7wwWRNk2EZwA%2F640%3Fwx_fmt%3Dpng"/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><ul class="list-paddingleft-2" style="list-style-type: disc;"><li style="font-size: 16px;font-weight: bold;"><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">联合类型注入</span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span></p></li></ul><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">该类型的注入方法与布尔类型注入方法有共通点：也是需要页面结果来进行确定。但略微不同的是所查询的结果是会出现在返回的数据中。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">该类型的注入方法在payload上会带上“union”，因此较好识别。在进行确认时需要关注返回数据中是否出现payload中所查询的数据。同时攻击者在攻击过程中会出现少量用于确定字段数的尝试，而在尝试中一般会用“null”进行填充（mysql数据库为例）。确定字段数的原因是因为“union”关键字的前后两个查询语句的字段数需要一致，而用“null”填充则是可以避免因为字段类型不同而导致错误。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><ul class="list-paddingleft-2" style="list-style-type: disc;"><li style="font-size: 16px;font-weight: bold;"><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">堆叠类型注入</span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"></span></p></li></ul><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">直接从名字上可能稍微有点难以理解该类型的具体注入方法，但换个角度解释的话就能更好的理解：payload中一定会出现“;”分号，且分号后面跟的是一个完整、能直接执行的SQL语句。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">在实际过程中堆叠类型注入确实比较少见的，因为这与后台查询所用的api有所关联，但直接在数据库是能够执行成功的。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">在流量侧中该类型的注入因为可以执行完整的SQL语句，因此既可能是有页面回显的，也有可能是没有页面回显的，要根据所使用的payload进行确定。</span></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><ul class="list-paddingleft-2" style="list-style-type: disc;"><li style="font-size: 16px;font-weight: bold;"><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;">时间类型注入</span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><strong><span style="font-size: 16px;"></span></strong><span style="font-size: 16px;"></span></p></li></ul><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">该类型比较特殊，需要计算请求包和返回包的时间戳之差来判断，而不是单纯的通过返回包的数据特征。这里的时间戳是指http请求中所记录的时间，而不是指事件/日志自身的时间戳。而具体的时间范围则要查看payload中所使用的时间，一般而言都是5秒左右。</span></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="text-align: left;font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;">实际流量日志中会有多个时间戳：</span></p><p style="text-align: left;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages js_insertlocalimg" data-ratio="0.6078125" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=efae9ab4&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTRqjicSI17ia4rAibCeqEWYZyNzPNJMZUWtodbmBNLxs1nVtxV7Jvcm7ngl4XJWPnewl6ew2lhc0R2A%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><br/></p><hr style="border-style: solid;border-width: 1px 0px 0px;border-color: rgba(0, 0, 0, 0.1);transform-origin: 0px 0px;transform: scale(1, 0.5);"/><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-align: center;"><strong><span style="font-size: 20px;">三、总结</span></strong></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-align: left;"><br/></p><p style="font-size: 14px;font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;text-align: left;"><span style="font-size: 16px;text-align: justify;">实际中</span><span style="font-size: 16px;text-align: justify;">攻击者所采用的攻击手法变化多端，因此只能简单介绍常见注入方法的特点，以便在面对大量此类告警时如何能够快速的进行是否注入成功的判断。</span><span style="font-size: 16px;text-align: justify;">后面我们会进一步介绍如何通过自动化的方法来进行处理。</span><br/></p><p style="font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="1" data-s="300,640" data-w="258" data-type="jpeg" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(53, 53, 53);letter-spacing: 0.544px;text-align: start;font-size: 15px;box-sizing: border-box !important;overflow-wrap: break-word !important;">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。欢迎关注~</span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br style="white-space: normal;"/></p><p style="font-family: DengXian;color: rgb(0, 0, 0);white-space: normal;"><span style="font-size: 16px;"><br/></span><br/></p>



<p><a href="2247484068">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=2f4a42ca&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484068%26idx%3D1%26sn%3D1da8170074a662b1e57b6c3009f576f4%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 15 Jun 2020 12:00:00 +0800</pubDate>
    </item>
    <item>
      <title>智能威胁检测：基于SOC时间序列算法的可疑外网IP周期连接检测</title>
      <link>https://mp.weixin.qq.com/s?__biz=MzI2NDUyMjAyOA==&amp;mid=2247484046&amp;idx=1&amp;sn=a6c3c90bf1d0a61df0591a92e5e36932</link>
      <description>本篇主要介绍基于SOC机器学习检测框架的时间序列建模的一个场景：可疑外网IP周期连接检测。</description>
      <content:encoded><![CDATA[<p>
原创 <span>陈嘉豪 郭豪 宜娜</span> <span>2020-06-08 12:00</span> <span style="display: inline-block;"></span>
</p>

<p>本篇主要介绍基于SOC机器学习检测框架的时间序列建模的一个场景：可疑外网IP周期连接检测。</p>
<p></p>



<p>
<img src="https://wechat2rss.xlab.app/img-proxy/?k=37454ea8&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrRbrSvetavxBnRQhJYI5eia8HfvlrgZUuxtR4vrDPAOBMkR5Qsf7t8fTQ%2F0%3Fwx_fmt%3Djpeg"/>
</p>


<p><strong><span style="font-size: 16px;color: rgb(0, 0, 0);">导语</span></strong><span style="font-size: 16px;color: rgb(0, 0, 0);">  基于Spark的SOC ML检测平台是为企业安全运营人员打造的一站式机器学习检测服务平台，为用户提供从数据预处理、特征转换、特征提取、模型训练、模型预测、异常结果可视化到用户实时反馈的全流程可配置（无需编写代码）可直接运用于生产环境的智能威胁检测服务。</span></p><p><span style="font-size: 16px;color: rgb(0, 0, 0);"><br/></span></p><p><span style="font-size: 16px;color: rgb(0, 0, 0);">本篇主要介绍基于SOC机器学习检测框架的时间序列建模的一个场景：可疑外网IP周期连接检测。</span></p><p><span style="font-family: 宋体;color: rgb(102, 102, 102);font-size: 16px;"><br/></span></p><p style="text-align: center;"><span style="color: rgb(0, 0, 0);font-size: 20px;"><strong><span style="font-size: 20px;color: rgb(0, 0, 0);font-family: 宋体;"><strong style="max-width: 100%;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;text-align: center;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 20px;color: rgb(0, 0, 0);max-width: 100%;line-height: 20px;box-sizing: border-box !important;overflow-wrap: break-word !important;">一、SOC</span></strong><strong style="max-width: 100%;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;text-align: center;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 20px;color: rgb(0, 0, 0);max-width: 100%;line-height: 20px;font-family: 宋体;box-sizing: border-box !important;overflow-wrap: break-word !important;">机器学习检测框架及<strong><span style="font-size: 20px;color: rgb(0, 0, 0);font-family: 宋体;">时间序列</span></strong>建模简述</span></strong></span></strong></span></p><p><br/></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;">企业里的威胁检测主要针对细分安全场景进行检测，场景多且不同企业关注场景可能不同。我们针对于企业威胁检测的特点构建了统一的SOC机器学习检测框架，框架的目的有两个:</span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><ul class="list-paddingleft-2" style="max-width: 100%;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);overflow-wrap: break-word !important;"><li style="max-width: 100%;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;">支撑SOC内置场景检测，丰富UEBA模块，增强SOC安全检测能力。</span></p></li><li style="max-width: 100%;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;">提供客户自定义场景功能，以满足客户自定义场景发现未知威胁的能力。</span></p></li></ul><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;">基于SOC机器学习检测框架的内置检测场景:</strong></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></strong></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.5322108345534406" data-s="300,640" style="" data-type="png" data-w="1366" src="https://wechat2rss.xlab.app/img-proxy/?k=b1cb4556&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavRH3cIZNS2YiadzicWh5G9ZCQgWHicC5HnEcicvN5eOFwzsbEVamjSoKKq6rSOaicznYa08MbNFa71f5Fg%2F640%3Fwx_fmt%3Dpng"/></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;box-sizing: border-box !important;overflow-wrap: break-word !important;">时间序列异常检测：</span></strong></span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;">时间序列分析是将历史数据在时间维度上按先后顺序构建时间序列，并通过一系列相关模型进行建模识别潜在模式，以便对后续数据进行预测或者异常检测。</span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;max-width: 100%;font-family: 宋体;box-sizing: border-box !important;overflow-wrap: break-word !important;">根据时间序列本身的特点，我们将时间序列分为<strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;">周期性的时间序列和非周期性的时间序列</strong>。对不同类型的时间序列应用不同的算法建模。</span></p><p style="max-width: 100%;min-height: 1em;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family:宋体;"><span style="font-size: 16px;"><br/></span></span><span style="font-family: 宋体;font-size: 16px;max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;">例如：</span><span style="font-family: 宋体;font-size: 16px;color: rgb(0, 0, 0);max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;">周期性的时间序列应用STL, Holt-Winters等算法建模；非周期性的时间序列应用小波变换等算法建模。</span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="max-width: 100%;font-family: 宋体;box-sizing: border-box !important;overflow-wrap: break-word !important;">本文将介绍SOC机器学习框架支撑的一个内置场景检测：</span><span style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;">可疑外网</span>IP<span style="font-family: 宋体;">周期连接</span></span></strong><span style="max-width: 100%;font-family: 宋体;">。<span style="font-family: 宋体;">在该检测场景中，受感染</span>/<span style="font-family: 宋体;">受控机器会定时访问外网</span>IP<span style="font-family: 宋体;">，基于这种周期性较强的特征，我们主要基于结合历史数据和安全策略来检测可疑行为。</span></span></span></span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 20px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong style="max-width: 100%;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;text-align: center;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 20px;max-width: 100%;line-height: 20px;font-family: 宋体;box-sizing: border-box !important;overflow-wrap: break-word !important;">二、</span></strong><strong style="max-width: 100%;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;text-align: center;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 20px;max-width: 100%;line-height: 20px;font-family: 宋体;box-sizing: border-box !important;overflow-wrap: break-word !important;">可疑外网IP周期连接（RecurringRare IP Access）</span></strong></span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;">可疑外网IP周期连接（RecurringRare IP Access）是指在特定的局域网内部（如企业内网），存在某个主机，在某段历史时间中有周期性地访问外部的稀有IP，且内网的其他主机几乎没有或者从不访问该IP。则该主机访问该外网IP的行为便是可疑外网IP周期连接行为。</span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;">可疑外网IP周期性连接行为属于Command&amp;Control攻击阶段，可覆盖的场景包括但不仅限于特定的恶意软件定期与外网C&amp;C服务器通信；定时脚本执行等。</span></p><p style="max-width: 100%;min-height: 1em;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;font-family: 宋体;font-size: 16px;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.4239558707643814" data-s="300,640" style="" data-type="png" data-w="1269" src="https://wechat2rss.xlab.app/img-proxy/?k=d6a853bb&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrRC1iaY0DFib7dvr5l8GckhpOdQd68lp8ZRMU6OptswkY3A6l2lMzxwfmw%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><br/></p><p style="text-align: left;"><span style="font-family: 宋体;text-align: justify;text-indent: 28px;font-size: 16px;"><strong style="max-width: 100%;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="text-align: justify;text-indent: 28px;max-width: 100%;font-family: 宋体;box-sizing: border-box !important;overflow-wrap: break-word !important;">业界相关场景检测方法：</span></strong></span></p><p style="text-align: left;"><span style="font-family: 宋体;text-align: justify;text-indent: 28px;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-align: justify;text-indent: 28px;font-family: 宋体;font-size: 16px;">目前对于时间序列的周期性检测方式主要包含传统的统计分析以及心跳检测方式。</span></p><p style="text-align: left;"><br/></p><p><span style="text-align: justify;text-indent: 28px;font-family: 宋体;font-size: 16px;">传统的统计分析方式主要以人为设定周期采样分段，然后计算每段的均值方差，基于统计规则来判断是否包含周期分量。传统的心跳检测主要以判断TCP心跳包的情况，在设定的时间段内判断连接是否存在，从而推断心跳周期。</span></p><p><br/></p><p><span style="text-align: justify;text-indent: 28px;font-family: 宋体;font-size: 16px;">同时也有基于信号处理的心跳检测方法，如单独使用FFT计算时间序列的幅频关系，从而验证时间序列的周期性进行心跳检测。</span></p><p><br/></p><p style="text-align: left;"><span style="text-align: justify;text-indent: 28px;font-family: 宋体;font-size: 16px;">而现有技术方案存在的缺陷主要有如下几点：</span></p><p style="text-align: left;"><span style="text-align: justify;text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><ul class="list-paddingleft-2" style="list-style-type: disc;"><li style="font-size: 16px;"><p style="text-align: left;"><span style="text-align: justify;text-indent: 28px;font-family: 宋体;font-size: 16px;">基于数学统计和传统心跳检测的检测方法需要经验知识来人为设定周期阈值，容易被绕过。对于时间序列的周期相似性缺少校验，无法有效地判断周期是否合理，周期结果会与实际时间序列不符。</span></p><p style="text-align: left;"><span style="text-align: justify;text-indent: 28px;font-family: 宋体;font-size: 16px;"></span></p></li><li style="font-size: 16px;"><p style="text-align: left;"><span style="text-align: justify;text-indent: 28px;font-family: 宋体;font-size: 16px;">而单独使用FFT方法对于时变信号的时间序列检测效果较差，无法有效验证周期的合理性。</span></p></li></ul><p style="text-align: left;"><span style="text-align: justify;text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: left;"><span style="text-align: justify;text-indent: 28px;font-family: 宋体;letter-spacing: 0.544px;background-color: rgb(255, 255, 255);font-size: 16px;">基于SOC ML检测框架的方法如下图所示：</span></p><p style="text-align: left;"><span style="text-align: justify;text-indent: 28px;font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.47109375" data-s="300,640" style="" data-type="png" data-w="1280" src="https://wechat2rss.xlab.app/img-proxy/?k=583db839&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrRicnUybvNVgl6VkeIg0LzIBpU7qRU7Bq6Dw6YbJfic91ucEWLeKUc5U8g%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><br/></p><p style="max-width: 100%;min-height: 1em;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 20px;"><strong style="max-width: 100%;font-family: -apple-system-font, BlinkMacSystemFont, &#34;Helvetica Neue&#34;, &#34;PingFang SC&#34;, &#34;Hiragino Sans GB&#34;, &#34;Microsoft YaHei UI&#34;, &#34;Microsoft YaHei&#34;, Arial, sans-serif;font-size: 18px;letter-spacing: 0.544px;white-space: normal;background-color: rgb(255, 255, 255);box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 20px;max-width: 100%;font-family: 宋体;box-sizing: border-box !important;overflow-wrap: break-word !important;">三、检测方法</span></strong></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">针对可疑外网</span>IP<span style="font-family: 宋体;">周期性访问场景，检测的整体流程如下图所示。</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="text-align: center;"><img class="rich_pages" data-ratio="3.188311688311688" data-s="300,640" style="width: 113px;height: 360px;" data-type="png" data-w="308" src="https://wechat2rss.xlab.app/img-proxy/?k=29c2eae7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrRI99FSrYqwmXWvBiceZice37qcDp4bG5ND4XZ54pLxu5WHKB5HW7TUOCw%2F640%3Fwx_fmt%3Dpng"/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><strong>3.1 <span style="font-family: 宋体;">特征预处理</span></strong><span style="font-family: 宋体;"></span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">以内网源</span>IP<span style="font-family: 宋体;">和外网目的</span>IP<span style="font-family: 宋体;">作为主要观察对象进行特征提取。提取的特征值为</span>TCP<span style="font-family: 宋体;">的传输数据大小，并以</span>n<span style="font-family: 宋体;">分钟为时间粒度进行累加统计，作为最终特征。</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">以源</span>IP<span style="font-family: 宋体;">，目的</span>IP<span style="font-family: 宋体;">，时间戳（分钟为粒度），传输数据大小的特征值形式构成时间序列数据模型。再利用平滑滤波器对时间序列进行降噪平滑处理。特别地，当时间序列为稀疏时间序列时，不做降噪平滑处理。</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><strong>3.2 FFT_DTW<span style="font-family: 宋体;">时间序列相似性周期检测</span></strong><span style="font-family: 宋体;"></span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">相似性周期检测算法主要分为两步，首先利用</span>FFT<span style="font-family: 宋体;">（</span>FastFourier Transform<span style="font-family: 宋体;">，快速傅里叶变换）对时间序列进行周期检测。获取时间序列的周期值</span>T<span style="font-family: 宋体;">。其次，以获取的周期</span>T<span style="font-family: 宋体;">对时间序列进行分段，利用</span>DTW<span style="font-family: 宋体;">（</span>DynamicTime Warping<span style="font-family: 宋体;">，动态时间规整）分析各周期片段的相似性。并根据相似性结果来判断最终整个时间序列是否为周期相似的。</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">1） 利用</span>FFT<span style="font-family: 宋体;">将时间序列转换到频域。并计算获取幅频关系。对于周期时不变时间序列，即我们主要的检出对象，基于</span>FFT<span style="font-family: 宋体;">的周期检测将会是准确高效的，如下图所示。左图中的周期为</span>1440min<span style="font-family: 宋体;">。</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><table><tbody><tr><td width="268" valign="top" style="word-break: break-all;"><span style="font-family: 楷体_GB2312;font-size: 16px;"> 原时间序列</span></td><td width="268" valign="top" style="word-break: break-all;"><span style="font-family: 楷体_GB2312;font-size: 16px;"> FFT变换幅频图</span></td></tr><tr><td width="268" valign="top"><p style="text-align: center;"><img class="rich_pages" data-ratio="0.75" data-s="300,640" style="" data-type="png" data-w="640" src="https://wechat2rss.xlab.app/img-proxy/?k=6b85a86e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrRSzrtJasSIZ7jhM4XRUcHDHJlEHZfBkAO3D33x5vWx1uZIHXQs6l8Bg%2F640%3Fwx_fmt%3Dpng"/></p></td><td width="268" valign="top"><p style="text-align: center;"><img class="rich_pages" data-ratio="0.75" data-s="300,640" style="" data-type="png" data-w="640" src="https://wechat2rss.xlab.app/img-proxy/?k=56f69dac&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrR2gOUXTMSJTJzI9vZ12Lc6WNkJRVyJicOVZiceia5SKrUDUIjTNeKyib4kA%2F640%3Fwx_fmt%3Dpng"/></p></td></tr></tbody></table><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">然而</span>FFT<span style="font-family: 宋体;">对于时变信号以及非周期时间序列的周期检测结果需要作进一步验证进行排除。</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">2） 利用</span>DWT<span style="font-family: 宋体;">算法对时间序列的周期片段进行相似性检测。</span></span><span style="font-size: 16px;"><span style="font-family: 宋体;"></span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;">假设有两个时间序列<em><span style="font-family: 楷体_GB2312;">x</span></em><span style="font-family: 楷体_GB2312;">(t<sub>1</sub>),<em>y</em>(t<sub>2</sub>)</span>,他们的时间长度分别为n和m，则可以构成一个n*m的矩阵D(i,j)，其中每个矩阵的值d(i,j)为x(i)与y(j)的欧氏距离，如下图所示。DTW的目的是找到从D(0,0)到D(n,m)之间的路径。且该最小值为这两个时间序列的相似度值。</span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.4067796610169492" data-s="300,640" style="" data-type="png" data-w="118" src="https://wechat2rss.xlab.app/img-proxy/?k=df6b1403&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrR7kwa8f4e4p2uCZIEees3icJEJzhNreNZOfvZJoMC5CMl3iapUBErNic5Q%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.6920444824636441" data-s="300,640" style="width: 438px;height: 303px;" data-type="png" data-w="1169" src="https://wechat2rss.xlab.app/img-proxy/?k=3a4228a7&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrRNBaPibExIcqOsE0UIVgg6gYptJqTlibmwiaxoaKqVicDZia9CtFpibCibdr9g%2F640%3Fwx_fmt%3Dpng"/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">利用计算出来的</span>T<span style="font-family: 宋体;">周期，对原始数据进行切片分段。如果输入序列为</span>N<span style="font-family: 宋体;">，则可以分成</span>N/T<span style="font-family: 宋体;">个片段。特别地，由于</span>DTW<span style="font-family: 宋体;">对于稀疏时间序列的相似性检测的参考性较低。因此为了确保检测的有效性，对于稀疏时间序列进行单独的统计对比。而对于非稀疏时间序列进行</span>DTW<span style="font-family: 宋体;">相似度计算。</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">比较两个相邻时间单元的相似度，也就是求相邻单元的</span>DTW<span style="font-family: 宋体;">距离。假如有</span>N<span style="font-family: 宋体;">个时间单元的话，就需要求</span>N-1<span style="font-family: 宋体;">次距离。将所有的距离值保存到列表中，根据设置的阈值，就可以判断出是否具有周期性。</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">当阈值大于相似度值时，说明两个片段相似，否则不相似；而对于整体的时间序列周期而言，我们会得到</span>N-1<span style="font-family: 宋体;">个相似度值的结果列表，其中超过一定占比的结果为相似时，则判定整个时间序列为周期性相似序列；否则只判定为周期性序列</span>。</span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong><span style="font-size: 16px;">3.3 <span style="font-family: 宋体;">策略制定</span></span></strong><span style="font-size: 16px;"><span style="font-family: 宋体;"></span><br/></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">对</span>FFT_DTW<span style="font-family: 宋体;">相似性周期检测算法的结果进行规则过滤。针对可疑外网</span>IP<span style="font-family: 宋体;">周期连接的规则策略具体如下：</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><ul class="list-paddingleft-2" style="list-style-type: disc;"><li style="font-size: 16px;"><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">获取可疑结果中所有的外网目的</span>IP<span style="font-family: 宋体;">记录；</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;"></span></span></p></li><li style="font-size: 16px;"><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">统计固定时间内正常流量访问这些外网目的</span>IP<span style="font-family: 宋体;">的内网</span>IP<span style="font-family: 宋体;">去重计数</span>normal_count<span style="font-family: 宋体;">；</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;"></span></span></p></li><li style="font-size: 16px;"><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">设置策略阈值</span>normal_th<span style="font-family: 宋体;">，当</span>normal_count&gt;normal_th<span style="font-family: 宋体;">时，判定该外网</span>IP<span style="font-family: 宋体;">被访问次数较多，排除可疑性。</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;"></span></span></p></li></ul><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="font-family: 宋体;">最终输出策略过滤后的可疑外网</span>IP<span style="font-family: 宋体;">周期连接检测结果。</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="max-width: 100%;min-height: 1em;text-align: center;box-sizing: border-box !important;overflow-wrap: break-word !important;"><strong><span style="font-size: 20px;"><span style="font-size: 20px;max-width: 100%;font-family: 宋体;box-sizing: border-box !important;overflow-wrap: break-word !important;">四、</span><span style="font-size: 20px;font-family: 宋体;">检测效果</span></span></strong></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;">检测结果示例：</span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><strong style="text-indent: 28px;"><span style="font-family: 宋体;">示例一</span></strong><span style="text-indent: 28px;font-family: 宋体;">：检测到某内网</span><span style="text-indent: 28px;">IP</span><span style="text-indent: 28px;font-family: 宋体;">一周内定时与外网某稀有</span><span style="text-indent: 28px;">IP</span><span style="text-indent: 28px;font-family: 宋体;">通信</span></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><span style="text-indent: 28px;font-family: 宋体;"><br/></span></span></p><p><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">描述</span></strong><span style="font-family: 宋体;">：内网某</span>IP<span style="font-family: 宋体;">每天下午</span>15:14:00<span style="font-family: 宋体;">通过</span>TCP<span style="font-family: 宋体;">定时与外网某</span>IP<span style="font-family: 宋体;">发生通信。最近一次通信时间为</span>2019-11-18 15:14:00<span style="font-family: 宋体;">。</span></span></p><p><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.75" data-s="300,640" style="width: 358px;height: 269px;" data-type="png" data-w="640" src="https://wechat2rss.xlab.app/img-proxy/?k=402248ef&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrRH4hB6Ttibib3Y9KVeLAUQ3HHicVYwoWSF2KibSKjwqrorhvslXmhdvibxMQ%2F640%3Fwx_fmt%3Dpng"/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-size: 16px;"><br/></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;"><strong>示例二</strong>：检测到某内网IP两周内保持与外网某稀有IP的通信连接，传输数据呈周期性。</span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;"><strong>描述</strong>：内网某IP自2019-11-06开始通过TCP定时与外网某IP保持两周时间的通信，且传输数据大小呈周期相似性。周期为1440分钟，即1天。</span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="font-family: 宋体;font-size: 16px;"><br/></span></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.7486486486486487" data-s="300,640" style="" data-type="png" data-w="370" src="https://wechat2rss.xlab.app/img-proxy/?k=bd5b146e&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrRW0cYia8oaHF3uSFw02ibglHibXLBExmcbj5JicvZQuBcpOg4oYL3icVuQLQ%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><br/></p><p style="text-align: left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">示例三</span></strong><span style="font-family: 宋体;">：检测到某内网</span>IP<span style="font-family: 宋体;">在一天内每隔</span>6<span style="font-family: 宋体;">小时向外网某稀有</span>IP<span style="font-family: 宋体;">发送一次数据。</span></span></p><p style="text-align: left;"><span style="font-size: 16px;"><span style="font-family: 宋体;"><br/></span></span></p><p style="text-align: left;"><span style="font-size: 16px;"><strong><span style="font-family: 宋体;">描述</span></strong><span style="font-family: 宋体;">：内网某</span>IP<span style="font-family: 宋体;">自</span>2019-11-07<span style="font-family: 宋体;">晚</span>21:40:00<span style="font-family: 宋体;">起，每隔</span>6<span style="font-family: 宋体;">小时定时向外网某稀有</span>IP<span style="font-family: 宋体;">发送一次大小为</span>175byte<span style="font-family: 宋体;">的数据。</span></span></p><p style="text-align: left;"><br/></p><p style="text-align: center;"><img class="rich_pages" data-ratio="0.75" data-s="300,640" style="width: 354px;height: 266px;" data-type="png" data-w="640" src="https://wechat2rss.xlab.app/img-proxy/?k=e3ee7e7a&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_png%2FPS7NCCJ5iavTZ1GzAopq8gNJHyX4yDibrRE49FBJP5x94BtnetUpHJXdrxonHDMhGWkqPTSEjRC3AypbACBJ6o4w%2F640%3Fwx_fmt%3Dpng"/></p><p style="text-align: left;"><br/></p><p style="text-align: center;"><img class="rich_pages" data-ratio="1" data-s="300,640" style="" data-type="jpeg" data-w="258" src="https://wechat2rss.xlab.app/img-proxy/?k=b0a69753&amp;u=https%3A%2F%2Fmmbiz.qpic.cn%2Fmmbiz_jpg%2FPS7NCCJ5iavSz7LFPYXY88tnoMia4alOPLwV3deKUb417g6T16y0jxazq6DqMYK8caGmsXdicPXSmSjb3sGXUibGbw%2F640%3Fwx_fmt%3Djpeg"/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><span style="max-width: 100%;color: rgb(53, 53, 53);letter-spacing: 0.544px;text-align: start;font-size: 15px;box-sizing: border-box !important;overflow-wrap: break-word !important;">该账号主要围绕智能化技术如何帮助企业提升网络安全水平展开，内容涉及机器学习、大数据处理等智能化技术在安全领域的实践经验分享，业界领先的产品和前沿趋势的解读分析等。通过分享、交流，推动安全智能的落地、应用。欢迎关注~</span></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p><p style="max-width: 100%;min-height: 1em;box-sizing: border-box !important;overflow-wrap: break-word !important;"><br/></p>



<p><a href="2247484046">阅读原文</a></p>
<p><a href="https://wechat2rss.xlab.app/link-proxy/?k=cf31f87e&amp;r=1&amp;u=https%3A%2F%2Fmp.weixin.qq.com%2Fs%3F__biz%3DMzI2NDUyMjAyOA%3D%3D%26mid%3D2247484046%26idx%3D1%26sn%3Da6c3c90bf1d0a61df0591a92e5e36932%26subscene%3D0">跳转微信打开</a></p>
]]></content:encoded>
      <pubDate>Mon, 08 Jun 2020 12:00:00 +0800</pubDate>
    </item>
  </channel>
</rss>