和同事讨论一些脑洞的时候有一些分歧:能否通过一些 cv 算法,比如 phash 来提升大模型的视图效率,甚至搞一个 app 的页面的知识图谱。我觉得无论大模型如何降本,大概率大模型提速降本的同时 cv 算法也会提速降本(比如更新更便宜的显卡出现,肯定是无差别的提速降本),此时这些「古典方法」仍然可以发挥价值,一个典型的 case 是 o3 在读图的时候其实经常写一些 python 脚本去处理图片。同事觉得这些「低科技」最终都会被 AI 取代,并且 AI 能力进步太快,这些手搓的东西很可能成为累赘,比如,是不是当每次 o3 写脚本读图的时候,回答质量反而比不用读图的时候更差?
求见解。