快速访问通道
首页
新闻动态
研究团队
教学相关
招聘招生信息
English Vesion (Updating)
首页
新闻动态
大新闻
实验室动态
学术报告
研究团队
教授
博后
博士生
硕士生
毕业生
实验室助理
以往成员
研究成果
代表作论文
论文
专利及软著
主要获奖
专著书籍
讲座视频
支持的项目
研究方向
自动驾驶
文档图像智能
遥感检测
视频分析
工业检测
医疗辅助诊断
教学相关
招聘招生信息
联系我们
照相馆
Open Menu
首页
新闻动态
返回
大新闻
实验室动态
学术报告
研究团队
返回
教授
博后
博士生
硕士生
毕业生
实验室助理
以往成员
研究成果
返回
代表作论文
论文
专利及软著
主要获奖
专著书籍
讲座视频
支持的项目
研究方向
返回
自动驾驶
文档图像智能
遥感检测
视频分析
工业检测
医疗辅助诊断
教学相关
招聘招生信息
联系我们
返回
照相馆
研究成果
代表作论文
论文
专利及软著
主要获奖
专著书籍
讲座视频
支持的项目
代表作论文
当前位置:
首页
>
研究成果
>
代表作论文
03
2022-12
【AAAI-2023】StereoDistill: Pick the Cream from LiDAR for Distilling Ster...
尽管基于激光雷达的三维物体检测方法表现出优异的性能,但其传感器高成本和对天气的敏感性限制了广泛的应用。近年来,基于双目视觉的方法具有低成本以及较为满意的精度,从而受到越来越多的关注。尽管如此,基于双目的和基于激光雷达的三维目标检测方法之间仍存在巨大的性能差距。在该论文中,我们提出了StereoDistill,其核心的想法是在响应层面,让双目模型获取来自激光雷达模型有利的知识。在KIITI数据集上,与现有的双目方法...
22
2022-09
【ECCV 2022 Oral】In Defense of Online Models for Video Instance Segmenta...
近年来,视频实例分割(VIS)在很大程度上是由离线模型推动的,而在线模型通常比同时代的离线模型相差很多,这是一个很大的缺点。 通过剖析当前的在线模型和离线模型,改论文证明了性能差距的主要原因是容易出错的帧间跟踪,并基于对比学习提出了 IDOL,它在三个基准上优于所有在线和离线方法。In recent years, video instance segmentation (VIS) has been largely advanced by offline models, while online models are us...
22
2022-09
【TIP 2022】End-to-End Temporal Action Detection with Transformer
这篇论文提出了一种基于Transformer的时序行为检测方法TadTR。TadTR引入了集合预测框架,极大地简化了时序行为检测的流程。该方法能直接将少量可学习的行为查询映射为完备、不重复的行为实例,去除了锚片段设计、后处理等经验式设计,方法的各个模块集成在单个完全可微分的神经网络中。TadTR相比先前性能最好的方法速度提升10倍,且在THUMOS14、ActivityNet和HACS Segments上取得了单网络方法的最佳性能。This paper proposes a...
22
2022-09
【ECCV 2022 Oral】SeqFormer:Sequential Transformer for Video Instance Se...
SeqFormer 是一个鲁棒、精准、简洁的离线视频实例分割模型,能够自然地解决物体在视频中的跟踪问题而不需要额外的跟踪分支和后处理操作。与现有的算法不同,SeqFormer 提出了一个 Query 分离的机制,将 Instance Query 分离成 Box Query,在每一帧分别去提取该物体对应位置的信息,然后进行聚合以在 video-level 更有效地表示每个 instance。SeqFormer is a robust, accurate, neat offline model and instance tracking is a...
21
2022-09
【ECCV 2020】 Epnet: Enhancing point features with image semantics for 3d...
在本文中,我们旨在解决 3D 检测任务中的两个关键问题,包括利用多个传感器(即 LiDAR 点云和相机图像)的融合,以及定位和分类置信度之间的不一致。为此,我们提出了一种新颖的融合模块,以逐点的方式用带有丰富语义信息的图像特征来增强点云特征。此外,采用一致性强制损失来鼓励定位和分类置信度的一致性。通过集成这两个组件,我们设计了一个名为 EPNet 的端到端可学习框架。在 KITTI 和 SUN-RGBD 数据集上的大量实验证明了...
21
2022-09
【AAAI 2020】Tanet: Robust 3d object detection from point clouds with tri...
本文专注于探索点云中三维目标检测的鲁棒性,这在现有方法中很少讨论。本文观察到两个关键现象:1)困难的物体(例如行人)的检测精度不令人满意,2)当添加额外的噪声点时,现有方法的性能迅速下降。为了缓解这些问题,本文引入了一种新颖的三元注意力网络,命名为TANet,其主要包含一个三重注意模块和一个由粗到精回归模块。三元注意力模块通过同时考虑通道级、点级和体素级的注意力,增强了目标物的关键信息,同时抑制了不稳...
30
2022-06
【中国科学 2022 封面论文】 工业缺陷检测深度学习方法综述
基于深度学习的工业缺陷检测方法可以降低传统人工质检的成本,提升检测的准确性与效率,成为计算机视觉领域的新兴热点之一。本综述对工业缺陷检测的任务定义、难点、挑战、主流方法、公共数据集及评价指标等进行了全面归纳。按照实际数据标注情况,划分出缺陷模式已知、缺陷模式未知与少量缺陷标3研究任务设置,并根据方法类型作进一步归纳与分析。探讨了各方法的性能优劣与适用场景。阐明了方法与实际应用需求的关联性。此外,...
03
2022-03
【TPAMI 2022】Real-Time Scene Text Detection with Differentiable Binariza...
DBNet++是DBNet (AAAI 2020) 文本检测算法的扩展版。该算法主要解决基于分割的文本检测方法需要复杂的后处理将像素级别的结果组合成文字行,导致预测时速度慢的问题。通过提出新颖的可微分二值化和自适应尺度融合模块,DBNet++达到了SOTA的性能,同时具备实时的运行速度。该算法被工业界广泛采用,如微信,OpenCV等。
01
2021-12
【Nature Machine Intelligence 2021】Advancing COVID-19 diagnosis with pri...
人工智能为简化新冠肺炎诊断提供了有前途的解决方案;然而,对于安全性和可信性的担忧阻碍了大规模医学数据的收集,这对临床实践中训练出一个有效的通用模型提出了挑战。为解决这一问题,本文启动了统一的 CT-COVID AI 诊断倡议(UCADI),在该倡议中,AI 模型可以在联邦学习框架下在每个托管机构进行分布式训练和独立执行,而无需共享数据。该联邦学习框架模型大大优于所有本地模型(中国的测试灵敏度/特异性为0.973/0.951,英...
01
2021-08
【Medical Image Analysis 2021】Deep learning for predicting COVID-19 mali...
新冠肺炎具有高传染性,在疫情爆发地区,许多患者同时涌入医院给公共医疗系统带来巨大压力。治疗优先级通常取决于首次评估的病情严重程度。然而,临床观察表明,一些轻症患者可能会迅速恶化。因此,尽早识别出可能存在病情恶化的患者对优化治疗策略至关重要。本文开发了一个基于深度学习的早期预警系统,以预测新冠肺炎患者的恶性进展。该方法利用患者的CT扫描和门诊临床数据,在单中心研究中达到了0.920的AUC。本文还提出一种...
首页
上页
1
2
下页
尾页
到第
页
跳转
Copyright © 2022 Vision and Learning Representation Group