赛博禅心 2024年11月19日
读屏不靠截图:ChatGPT 客户端的原理、实现与边界
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_guoji1.html

 

ChatGPT Mac客户端新增功能,可连接VSCode、XCode、iTerm2等应用,直接读取应用窗口内容并将其作为提示词提交给GPT,实现智能问答和处理。该功能基于原生应用能力和用户授权,能够获取窗口完整内容,例如VSCode需要安装插件获取完整文本。ChatGPT会根据窗口内容进行处理,例如编辑器会包含全部内容,命令行窗口则包含最后200行内容,并可重点关注选中文本。虽然功能强大,但目前仅限于窗口级别,无法替代Cursor等项目级工具,且结果需要手动复制粘贴回窗口。

🤔ChatGPT Mac客户端可以连接VSCode、XCode、iTerm2等应用程序,直接读取这些应用程序窗口的内容,并将其作为提示词提交给GPT进行处理。

🖥️ChatGPT能够获取应用窗口的完整内容,例如VSCode需要额外安装插件获取完整文本,即使窗口被遮挡也能获取内容。

🔍ChatGPT会根据窗口内容进行处理,编辑器会包含全部内容,命令行窗口则包含最后200行内容,并能重点关注选中的文本。

⚠️该功能目前仅限于窗口级别,无法替代Cursor等项目级别的工具,处理结果需要手动复制粘贴回窗口。

💡通过鼠标悬停在ChatGPT Mac客户端横幅或历史消息顶部,可以查看发送的内容,了解其工作原理。

原创 宝玉xp 2024-11-19 20:24 广东

它的读屏,很会“抓重点”

ChatGPT 的 Mac 客户端现在可以连接常用的一些应用程序,比如 VSCode、XCode、iTerm2,这样可以直接就这些应用程序上的内容去提问,效果很棒! 

地址:https://openai.com/chatgpt/desktop 


它基于原生应用程序的能力以及加上用户对它的授权,可以获取到这些应用当前窗口的内容,然后将窗口的内容整理成提示词一起提交到 GPT,这样 GPT 就可以根据窗口内容来处理了,提示词类似于下面这样: 

<windows><instructions>You are being provided with textfield content from windows the user has asked you to focus on.
</instructions><window><title>Visual Studio Code</title><app_name>Code</app_name><textfields><textfield id="窗口文件名">【窗口内容】
</textfield></textfields></window></windows>


 

通过请求分析,可发现:它不是通过截图获取内容的,是直接获取窗口完整内容的,比如VSCode,需要额外安装插件以获取完整文本,所以窗口被遮挡也没关系。 



具体的请求分析

可以将鼠标悬停在 ChatGPT Mac 客户端横幅上,查看 ChatGPT 发送哪些内容。 

 

在历史消息中,鼠标悬停在消息顶部,也可以看发送过的内容。 



工程技巧与边界

仔细查看,发现:

 

这个功能确实不错,但要说能替代 Cursor 那还太扯了: 

跳转微信打开

Fish AI Reader

Fish AI Reader

AI辅助创作,多种专业模板,深度分析,高质量内容生成。从观点提取到深度思考,FishAI为您提供全方位的创作支持。新版本引入自定义参数,让您的创作更加个性化和精准。

FishAI

FishAI

鱼阅,AI 时代的下一个智能信息助手,助你摆脱信息焦虑

联系邮箱 441953276@qq.com

相关标签

ChatGPT Mac客户端 应用连接 智能读屏 GPT
相关文章