基于Pytorch的从零开始的目标检测 _Pytorch

引言目标检测是计算机视觉中一个非常流行的任务，在这个任务中，给定一个图像，你预测图像中物体的包围盒(通常是矩形的) ，并且识别物体的类型。在这个图像中可能有多个对象，而且现在有各种先进的技术和框架来解决这个问题，例如 Faster-RCNN 和 YOLOv3 。

文章插图
本文将讨论图像中只有一个感兴趣的对象的情况。这里的重点更多是关于如何读取图像及其边界框、调整大小和正确执行增强，而不是模型本身。目标是很好地掌握对象检测背后的基本思想，你可以对其进行扩展以更好地理解更复杂的技术。
本文中的所有代码都在下面的链接中：https://jovian.AI/aakanksha-ns/road-signs-bounding-box-prediction 。
问题陈述给定一个由路标组成的图像，预测路标周围的包围盒，并识别路标的类型。这些路标包括以下四种：

红绿灯
停止
车速限制
人行横道

这就是所谓的多任务学习问题，因为它涉及执行两个任务: 1)回归找到包围盒坐标，2)分类识别道路标志的类型。
1.数据集【基于Pytorch的从零开始的目标检测】我使用了来自 Kaggle 的道路标志检测数据集，链接如下：https://www.kaggle.com/andrewmvd/road-sign-detection
它由877张图像组成。这是一个相当不平衡的数据集，大多数图像属于限速类，但由于我们更关注边界框预测，因此可以忽略不平衡。
2.加载数据每个图像的注释都存储在单独的 XML 文件中。我按照以下步骤创建了训练数据集:

遍历训练目录以获得所有.xml 文件的列表。
使用xml.etree.ElementTree解析.xml文件。
创建一个由文件路径、宽度、高度、边界框坐标（ xmin 、 xmax 、 ymin 、 ymax ）和每个图像的类组成的字典，并将字典附加到列表中。
使用图像统计数据字典列表创建一个 Pandas 数据库。

def filelist(root, file_type):"""Returns a fully-qualified list of filenames under root directory"""return [os.path.join(directory_path, f) for directory_path, directory_name,files in os.walk(root) for f in files if f.endswith(file_type)]def generate_train_df (anno_path):annotations = filelist(anno_path, '.xml')anno_list = []for anno_path in annotations:root = ET.parse(anno_path).getroot()anno = {}anno['filename'] = Path(str(images_path) + '/'+ root.find("./filename").text)anno['width'] = root.find("./size/width").textanno['height'] = root.find("./size/height").textanno['class'] = root.find("./object/name").textanno['xmin'] = int(root.find("./object/bndbox/xmin").text)anno['ymin'] = int(root.find("./object/bndbox/ymin").text)anno['xmax'] = int(root.find("./object/bndbox/xmax").text)anno['ymax'] = int(root.find("./object/bndbox/ymax").text)anno_list.Append(anno)return pd.DataFrame(anno_list)

标签编码类列

#label encode targetclass_dict = {'speedlimit': 0, 'stop': 1, 'crosswalk': 2, 'trafficlight': 3}df_train['class'] = df_train['class'].apply(lambda x:class_dict[x])

3.调整图像和边界框的大小由于训练一个计算机视觉模型需要的图像是相同的大小，我们需要调整我们的图像和他们相应的包围盒。调整图像的大小很简单，但是调整包围盒的大小有点棘手，因为每个包围盒都与图像及其尺寸相关。
下面是调整包围盒大小的工作原理:

将边界框转换为与其对应的图像大小相同的图像（称为掩码）。这个掩码只有 0 表示背景，1 表示边界框覆盖的区域。
将掩码调整到所需的尺寸。

从调整完大小的掩码中提取边界框坐标。

def create_mask(bb, x):"""Creates a mask for the bounding box of same shape as image"""rows,cols,*_ = x.shapeY = np.zeros((rows, cols))bb = bb.astype(np.int)Y[bb[0]:bb[2], bb[1]:bb[3]] = 1.return Ydef mask_to_bb(Y):"""Convert mask Y to a bounding box, assumes 0 as background nonzero object"""cols, rows = np.nonzero(Y)if len(cols)==0:return np.zeros(4, dtype=np.float32)top_row = np.min(rows)left_col = np.min(cols)bottom_row = np.max(rows)right_col = np.max(cols)return np.array([left_col, top_row, right_col, bottom_row], dtype=np.float32)def create_bb_array(x):"""Generates bounding box array from a train_df row"""return np.array([x[5],x[4],x[7],x[6]])
上一页
1
2
3
下一页
		  	





























推荐阅读

           
                  
              
                  基金|建发股份：拟出资3037.5万元认购安科基金 
                
                   
                
              
            

                  
              
                  樱桃奶球|盘点五部鬼片可以当作搞笑片看的电影 
                
                   
                
              
            

                  
              
                  c罗|第79分钟，球王C罗射丢第10脚攻门，亲手送别大奖，留下无奈苦笑 
                
                   
                
              
            

                  
              
                  封面新闻|30秒｜韩星金贤重抢救昏迷者，事后回应“只是做了该做的事” 
                
                   
                
              
            

                  
              
                  对于六安瓜片，中国工程院院士有话说 
                
                   
                
              
            

                  
              
                  「中国特色社会主义」北京市发布全国文化中心建设未来15年规划 
                
                   
                
              
            

                  
              
                  怎样把皮肤变细腻白嫩 
                
                   
                
              
            

                  
              
                  挖贝网|营业成本同比减少，华电国际2020年上半年净利23.86亿增长43.49% 
                
                   
                
              
            

                  
              
                  法律博士试点!对美国法学博士的了解 
                
                   
                
              
            

                  
              
                  借款连累朋友，很难过 
                
                   
                
              
            

                  
              
                  春季谨防感冒发生 糖尿病患者巧用“香菜”可治病 
                
                   
                
              
            

                  
              
                  乐而雅零触感卫生巾安全吗 
                
                   
                
              
            

                  
              
                  怎样才能快速祛斑美白？ 快速美白祛斑 
                
                   
                
              
            

                  
              
                  酷玩四方|我的世界：最安全的火柴盒在高处？4个极具创意的MC建筑灵感 
                
                   
                
              
            

                  
              
                  音乐响起|一开就是大半年，沾土就活，新手也能养的好！，聪明人都养3种花 
                
                   
                
              
            

                  
              
                  安徽未来将有大发展的城市，不是芜湖和马鞍山，是你家乡吗 
                
                   
                
              
            

                  
              
                  国家经济|印度前国安顾问：中国远未被孤立 
                
                   
                
              
            

                  
              
                  怪咖搞笑|幽默笑话：几天前 因工作失误被老板训了半小时 
                
                   
                
              
            

                  
              
                  居民|儿童青少年超重肥胖问题凸显 
                
                   
                
              
            

                  
              
                  浙报融媒体|8个镇迎来发展契机，“萧山南花园”即将被串联 
                
                   
                
              
            

          

16个优秀的开源微信小程序项目，接单赚钱利器！ 

让Java起飞的技术... 

即将到来的 Vue 3 “Vapor Mode” 

学会使用Java的远程调试工具，解决难题 

Oracle数据库调优实战：优化SQL查询的黄金法则！ 

JVM的调优常用参数 

API请求重试的8种方法，你用哪种？ 

利用Docker简化机器学习应用程序的部署和可扩展性 

2024年的后端和Web开发趋势 

警惕“应用推荐”背后的信贷陷阱