我让GPT4为OriginBot开发了一个监控功能
zhezhongyun 2025-02-03 16:04 21 浏览
我在以前的博客中提到过,我在工作中大量使用ChatGPT(GPT4-32k)来辅助我,方案设计、函数编写、code review、编写测试案例以及Debug等等,虽然它做不到完全正确,但是作为一个辅助和参考工具,还是非常有用的。
这次为OriginBot开发监控功能的时候就想尝试用GPT4来完整地开发这个功能,我以前从来没有让GPT4做过完整的任务,因为它受限于上下文的长度,很难完成大型的任务。这是一次尝试,不过从结果来看,还是很不错的。
我使用的是GPT4-32k这个模型,能力相对于GPT3.5要强大不少,我想这也是效果不错的重要原因。
为了能让大家更容易理解下面的内容,我在这里解释一下文章的结构。
“Message From You”后面的内容是我的Prompt,也就是问题,“Message From ChatGPT”后面的内容是ChatGPT的回答。
我还会以引用的格式在一些地方加上我的说明,这些内容不在我跟ChatGPT的对话中。
所以,你如果想简要了解这边博客的话,只要看引用格式的部分就可以了。
_以下是正文,超长的正文,19555个字_
Message From You:
现在你是一名机器人开发方面的专家,熟悉ros2、SLAM、nav2、运动控制和规划等多种机器人相关的技术,也熟悉stm32等嵌入式开发,并且你还熟悉各种机器学习技能,我会交给你一些任务,请你仔细思考后完成这些任务
Message From ChatGPT:
当然,我很乐意帮助您解决问题。请明确告诉我您需要完成的任务和遇到的问题,我会尽力提供最佳的解决方案或建议。
这段对话中,我给ChatGPT赋予了一个机器人开发专家这样一个角色来激活领域知识,从我的使用经验来看,这么做对于提升GPT回答的有效性有一定的提升。
Message From You:
OriginBot是一个有MIPI摄像头、激光雷达、IMU的两轮机器人, 代码是基于ros2 foxy开发的,现在告诉你,OriginBot的摄像头启用后,会通过一个叫做image_raw的topic发布图像数据,现在我要在同一wifi下的另外一个服务器上,通过VUE3+Django+DRF来实时展现连续的视频,起到一个远程监控的作用,请你仔细思考之后拆解这个任务,详细的描述步骤
Message From ChatGPT:
要完成这项任务,我们可以大致将其拆解为以下几个步骤:
- 从ROS 2节点接收摄像头数据
- 你需要创建一个新的ROS 2节点来订阅image_raw topic。当有图像数据发布时,这个节点就能接收到。
- 这个节点可能需要使用一些ROS和机器视觉库(如cv_bridge和OpenCV),把ROS的Image消息转换成适合网络上传输的格式(比如JPEG或PNG)。
2.建立服务器与ROS节点间的通信
- 当ROS节点成功地获取并处理了图像数据后,下一步是在同一WiFi环境下的另一台服务器上建立监听服务。你可以利用WebSocket实现该功能,因为它支持实时、全双工、点对点的连接。
- 在你的ROS节点中,你需要增加WebSocket客户端代码以便于将处理后的图像数据发送给服务器。
3.设置Django + DRF服务器
- 在服务器上,建立一个Django项目,并且利用Django REST framework(DRF)构建API接口。
- 启动一个websocket server,在django project里面, 使用第三方库例如 channels 创建websocket route 来接收ROS节点发过来的图像数据。
4.存储和串流视频
- 往往连续的帧会被组织成视频序列。所以在你已经取得每个单独帧之后,你需要考虑如何把这些帧组织起来,并通过网页进行播放。
- 可以考虑采用某种串流协议如 MPEG-DASH 或 HLS 等。我不清楚 Django 是否内置了这样的功能,但应该有相应的库可以使用。
5.VUE3前端展示
- 利用Vue.js开发前端页面,通过 WebSocket 订阅摄像头捕获的图像流。
- 将接收到的图像以视频方式展示出来。HTML5 video player 或者其他第三方video.js library都可以用于实现这一需求。
以上就是整体的流程。具体实施过程中可能还会涉及到一些灵活调整和详细设计,例如错误处理、线程管理等。
GPT整个解决方案的框架和步骤,以及每个步骤的简单介绍,它给出的这个方案也许行得通,但是以我对于机器人开发有限的经验来看,并不是很好,所以我在后面对于这个框架进行了一定程度的修改。由此可见,并不能完全依赖ChatGPT的回答,一定要加以自己的判断。
Message From You:
现在请你给出第一步“从ROS 2节点接收摄像头数据”的详细说明、步骤、命令和代码,记住,要同时思考与其他所有步骤之间的关联性
Message From ChatGPT:
接收ROS 2节点摄像头数据的具体步骤如下:
1.环境准备
确保你已经安装了ros2 foxy和其他必要依赖库,例如 cv_bridge 和 OpenCV。
2.创建一个ROS 2 package
如果还没有创建过,你需要先创建一个新的ROS 2的package。假设我们将它命名为camera_listener. 以下是在终端中创建这个包的相关命令:
source /opt/ros/foxy/setup.bash # 配置ros2环境变量
mkdir -p ~/robot_ws/src # 创建工作空间和src目录,如果已存在可忽略此步
cd ~/robot_ws/src
ros2 pkg create --build-type ament_python camera_listener # 创建Python类型的ros2包
3.建立ROS 2节点并订阅topic
在camera_listener包中, 创建一个 python 文件(比如 listener.py),用于实现图象获取的 ROS 节点:
import rclpy
from rclpy.node import Node
from sensor_msgs.msg import Image
from cv_bridge import CvBridge
class CameraListener(Node):
def __init__(self):
super().__init__('camera_listener')
self.bridge = CvBridge()
self.subscription = self.create_subscription(
Image,
'image_raw',
self.listener_callback,
10)
self.subscription
def listener_callback(self, msg):
cv_image = self.bridge.imgmsg_to_cv2(msg, desired_encoding='passthrough')
# 对cv_image进行处理
def main(args=None):
rclpy.init(args=args)
camera_listener = CameraListener()
rclpy.spin(camera_listener)
# Destroy the node explicitly
camera_listener.destroy_node()
rclpy.shutdown()
if __name__ == '__main__':
main()
这段代码首先导入必要的模块,然后定义了一个CameraListener类,该类继承自Node,它订阅了’image_raw’ topic。每当有消息发布到这个topic时,都会触发listener_callback方法。
注意这里的imgmsg_to_cv2函数就是把ROS image message转为 OpenCV 的格式。
相关推荐
- JPA实体类注解,看这篇就全会了
-
基本注解@Entity标注于实体类声明语句之前,指出该Java类为实体类,将映射到指定的数据库表。name(可选):实体名称。缺省为实体类的非限定名称。该名称用于引用查询中的实体。不与@Tab...
- Dify教程02 - Dify+Deepseek零代码赋能,普通人也能开发AI应用
-
开始今天的教程之前,先解决昨天遇到的一个问题,docker安装Dify的时候有个报错,进入Dify面板的时候会出现“InternalServerError”的提示,log日志报错:S3_USE_A...
- 用离散标记重塑人体姿态:VQ-VAE实现关键点组合关系编码
-
在人体姿态估计领域,传统方法通常将关键点作为基本处理单元,这些关键点在人体骨架结构上代表关节位置(如肘部、膝盖和头部)的空间坐标。现有模型对这些关键点的预测主要采用两种范式:直接通过坐标回归或间接通过...
- B 客户端流RPC (clientstream Client Stream)
-
客户端编写一系列消息并将其发送到服务器,同样使用提供的流。一旦客户端写完消息,它就等待服务器读取消息并返回响应gRPC再次保证了单个RPC调用中的消息排序在客户端流RPC模式中,客户端会发送多个请...
- 我的模型我做主02——训练自己的大模型:简易入门指南
-
模型训练往往需要较高的配置,为了满足友友们的好奇心,这里我们不要内存,不要gpu,用最简单的方式,让大家感受一下什么是模型训练。基于你的硬件配置,我们可以设计一个完全在CPU上运行的简易模型训练方案。...
- 开源项目MessageNest打造个性化消息推送平台多种通知方式
-
今天介绍一个开源项目,MessageNest-可以打造个性化消息推送平台,整合邮件、钉钉、企业微信等多种通知方式。定制你的消息,让通知方式更灵活多样。开源地址:https://github.c...
- 使用投机规则API加快页面加载速度
-
当今的网络用户要求快速导航,从一个页面移动到另一个页面时应尽量减少延迟。投机规则应用程序接口(SpeculationRulesAPI)的出现改变了网络应用程序接口(WebAPI)领域的游戏规则。...
- JSONP安全攻防技术
-
关于JSONPJSONP全称是JSONwithPadding,是基于JSON格式的为解决跨域请求资源而产生的解决方案。它的基本原理是利用HTML的元素标签,远程调用JSON文件来实现数据传递。如果...
- 大数据Doris(六):编译 Doris遇到的问题
-
编译Doris遇到的问题一、js_generator.cc:(.text+0xfc3c):undefinedreferenceto`well_known_types_js’查找Doris...
- 网页内嵌PDF获取的办法
-
最近女王大人为了通过某认证考试,交了2000RMB,官方居然没有给线下教材资料,直接给的是在线教材,教材是PDF的但是是内嵌在网页内,可惜却没有给具体的PDF地址,无法下载,看到女王大人一点点的截图保...
- 印度女孩被邻居家客人性骚扰,父亲上门警告,反被围殴致死
-
微信的规则进行了调整希望大家看完故事多点“在看”,喜欢的话也点个分享和赞这样事儿君的推送才能继续出现在你的订阅列表里才能继续跟大家分享每个开怀大笑或拍案惊奇的好故事啦~话说只要稍微关注新闻的人,应该...
- 下周重要财经数据日程一览 (1229-0103)
-
下周焦点全球制造业PMI美国消费者信心指数美国首申失业救济人数值得注意的是,下周一希腊还将举行第三轮总统选举需要谷歌日历同步及部分智能手机(安卓,iPhone)同步日历功能的朋友请点击此链接,数据公布...
- PyTorch 深度学习实战(38):注意力机制全面解析
-
在上一篇文章中,我们探讨了分布式训练实战。本文将深入解析注意力机制的完整发展历程,从最初的Seq2Seq模型到革命性的Transformer架构。我们将使用PyTorch实现2个关键阶段的注意力机制变...
- 聊聊Spring AI的EmbeddingModel
-
序本文主要研究一下SpringAI的EmbeddingModelEmbeddingModelspring-ai-core/src/main/java/org/springframework/ai/e...
- 前端分享-少年了解过iframe么
-
iframe就像是HTML的「内嵌画布」,允许在页面中加载独立网页,如同在画布上叠加另一幅动态画卷。核心特性包括:独立上下文:每个iframe都拥有独立的DOM/CSS/JS环境(类似浏...
- 一周热门
- 最近发表
- 标签列表
-
- HTML 教程 (33)
- HTML 简介 (35)
- HTML 实例/测验 (32)
- HTML 测验 (32)
- HTML 参考手册 (28)
- JavaScript 和 HTML DOM 参考手册 (32)
- HTML 拓展阅读 (30)
- HTML中如何键入空格 (27)
- HTML常用标签 (29)
- HTML文本框样式 (31)
- HTML滚动条样式 (34)
- HTML5 浏览器支持 (33)
- HTML5 新元素 (33)
- HTML5 WebSocket (30)
- HTML5 代码规范 (32)
- HTML5 标签 (717)
- HTML5 标签 (已废弃) (75)
- HTML5电子书 (32)
- HTML5开发工具 (34)
- HTML5小游戏源码 (34)
- HTML5模板下载 (30)
- HTTP 状态消息 (33)
- HTTP 方法:GET 对比 POST (33)
- 键盘快捷键 (35)
- 标签 (226)