发布新话题与讨论建议及审查说明
欢迎发布有讨论和阅读价值的话题;不欢迎嘲弄宗教、种族、地缘、性取向等话题。
推崇布拉格公民论坛《对话守则》:对话的目的是寻求真理,不是为了斗争;不做人身攻击;保持主题;辩论时要用证据;要分清对话与只准自己讲话的区别;尽量理解对方。
遵循《世界人权宣言》第十九条不对用户已发表言论进行删除处理;用户有权限删除本人已发表言论;编辑会合并重复话题。
发新话题
收藏 订阅 推荐 打印

GFW遇到了效率瓶颈?

GFW遇到了效率瓶颈?

最近无聊翻了翻CNCERT/CC的通告,发现下面这个东西。
http://www.cert.org.cn/articles/ ... 2010051324982.shtml
这个竞赛的意思就是GFW说:我出钱,你来给我提高GFW运转效率!干得好,以后这种活还找你。
思路:多正则表达式匹配-深度包检测-功夫网。
我靠,正则都用上了,不会吧,莫非以后电话号码里包含 6 和 4 的都发不出去。。。。
北邮学生2006年的时候做的垃圾测试数据。我勒个艹。
肯定要用上正则 甚至LALR语义分析一类的玩意
效率问题无解 如果说gfw增长是几何级别 互联网的数据增长就是平方级别的 追不上
引用:
原帖由 DaemonEye 于 2010-6-2 23:54 发表
肯定要用上正则 甚至LALR语义分析一类的玩意
效率问题无解 如果说gfw增长是几何级别 互联网的数据增长就是平方级别的 追不上
我就奇怪了,几何级别的增长和平方级别的增长不是一回事吗?还是我弄错了?
引用:
原帖由 翱翔sky 于 2010-6-3 11:47 发表

我就奇怪了,几何级别的增长和平方级别的增长不是一回事吗?还是我弄错了?
说错了 gfw是代数增长...
算法早就被研究透了,效率还是要靠大规模并行计算解决。个人觉得数据包过滤这种事情正适合并行处理,也就是说只要花钱上硬件,应该没什么不好解决的。
正则解析相对来说应该很慢吧。。。
TG不缺钱,堆设备呗~
引用:
原帖由 george 于 2010-6-3 12:11 发表
算法早就被研究透了,效率还是要靠大规模并行计算解决。个人觉得数据包过滤这种事情正适合并行处理,也就是说只要花钱上硬件,应该没什么不好解决的。
并行处理耗得硬件资源更多,只是被分担了而已,草TM的GFW,浪费老子们的税钱
这种比赛也有,牛B~~~想想有谁去参加?搞无间道不错,嘿嘿~~~
其实正则表达式加速还是很有可能的。就是用不同的杂凑算法去匹配特征,这样无关的数据就可以快速通关,直到N层杂凑都能符合的时候,再去完整的正则表达,这时候如果还能匹配再reset...
方滨兴这老贼不上1984bbs吧。。。希望他没有看到
发新话题

快速回复主题

 

[完成后可按 Ctrl+Enter 发布]  预览话题  恢复数据  清空内容

顾问:莫之许、北风、不锈钢老鼠、温克坚、艾未未、冉云飞、安替、崔卫平、闾丘露薇、章立凡 形象代言:宋石男 法律顾问:浦志强
编辑
:张书记、上肛上腺、抑扬、musicool、王祖贤、alix001、核子力量、四夕亚日、炽鸢侯、木火
技术:库存袈裟、麦圆、散光