2023年政策修订增补工作正在进行中,欢迎参与!
User:宇文天启/更新姬推送规则
跳转到导航
跳转到搜索
嗯,如果更新姬推送规则要调整的话,大概写一下我的思路吧。
基本
推送间隔:白天(6:00-23:59)30分钟一次;夜间(0:00-5:59)1小时一次
每次推送开始时,获取上次推送时间至当前时间的这个时间段中,萌百创建和修改过的页面。分别计算这些页面的分数,最后按分数排序,排序第一的可进入此次推送队列。
如果这段时间没有页面改动过,则期间再往前包括一个时间段。
计分
- 同一条目在当前时间段被多人编辑的,取编辑量最大的一次,就是下表中的主体“用户”,但条目数据仍取当前版本。
- 变动字节取这一时间段的总和。
抓取事件 | 计分规则 | 说明 |
---|---|---|
新用户 | +2 | 为鼓励新用户,其参与编辑的条目有额外加分,这里的新用户指的是编辑数<20的用户 |
新条目 | +2 | 新创建的条目一般情况下作为创建者的重要贡献 |
用户为优质编辑者/巡查/管理 | +0.5 | 优质编辑者以上用户组作为萌百稳定的输出机器,其条目有质量保证,但为公平起见加分并不会很多 |
新增字节(n)>500 | +(min(n,2000)/1000) | 条目新增字节大于500时,按每1000字1分计算,最高2分 |
新条目长度<1000 | -1 | 新条目长度不够,可能是创建者没有认真创建条目 |
图片大小<600*600 | -1 | 配图像素较低,可能会影响推送显示效果 |
图片大小<300*300 | -2 | 配图像素极低,可能会严重影响推送显示效果 |
上次推送条目的用户和本次相同 | -1.5 | 为了让人人都有机会,降低重复推送一个用户编辑条目的概率 |
计分清零情况
- 以下情况出现后,之前所记分数全部清零,规则也可以写在计分之前,截断后续操作。
抓取事件 | 说明 |
---|---|
萌百基本规则 | 只有主空间的条目被允许推送,模板、用户页、讨论页等自动排除 |
带有分类“屏蔽更新姬推送的条目” | 条目可能因为某些原因不宜被推送 |
新条目长度<500 | 疑似低劣条目 |
删除字节>500 | 疑似破坏行为 |
无图 | 没有配图的条目 |
图片质量不合要求 | 错误图、过大的gif动态图等 |
已经被封禁的用户 | 用户已被封禁时,其参与编写的条目不被考虑(但如果是多人参与编辑,可能会有误伤。不过也就影响一次推送判定而已) |