深度学习与计算机视觉

Deep Learning and Computer Vision

深度学习与计算机视觉

ISBN: 978-981-5297-20-1 Date of Publication: 2024

深度学习是近年来机器学习领域发展最快的一个分支，代表了当前这个时代的人工智能技术，在学术界和产业界都取得了极大的成功。目前，深度学习在计算机视觉领域获得了很多成功的应用，例如图像分类、目标检测识别、图像分割、图像检索和图像生成等。未来仍然存在更多潜在应用，将会从很多方面改变整个人类的生活方式。深度学习作为机器学习的一个分支，以人工神经网络为基本框架，通过数据驱动的方式提取大量的数据规律和特征，它的出现大大提高了诸多机器学习任务的效果。除了在计算机视觉领域，深度学习在语音识别、自然语言处理、控制工程领域中都有广泛应用。计算机视觉是指利用计算机获取、分析和处理图像和视频信息的技术，使计算机具有接近人类视觉系统的能力。从学术研究的角度，计算机视觉技术从现实世界中提取高层次的信息，产生特征和语义信息，可理解为人脑将图像（视网膜的输入）转换为可以与其他个体交互并产生影响的信息，可以看作利用几何学、物理学、统计学理论构建模型，并从视觉数据中提炼符号信息的过程。研究人员希望计算机可以像人类一样，将外界输入的光信号转换为对外界的理解与认知，这将会促进人类科技与社会的发展，创造更高的科研价值。基于此，介绍有关深度学习与计算机视觉的内容非常迫切和重要，能为相关专业的学生以及对本领域感兴趣的学者提供了解本领域的重要途径。本书全面介绍了深度学习及计算机视觉中最基础的知识，并结合最常见的应用场景，带领读者进入丰富多彩的计算机视觉领域。针对不同层次的计算机视觉任务，结合现有研究成果，以及部分学界公认的里程碑式成果，从理论层面论述深度学习在具体计算机视觉任务中的应用。本书适合从事图像和视频的处理和理解的研究人员、相关领域软件开发人员或研究生阅读。

Editor-in-Chief

路明

路明，男，汉族，1994年2月生，河北邯郸人，硕士研究生学历，2018年毕业于英国伯明翰大学，现就读于天津大学，管理与经济学部。研究方向主要包含计算机视觉领域图像目标识别、自然语言处理领域文本分析处理等，已发表国际期刊会议论文四篇，曾多次获得国家级奖学金，并获得大连市优秀毕业生称号。

裴建新

裴建新，男，汉族，1981年6月生，四川成都人，本科学历，2004 年毕业于北方工业大学，现就职于四川九洲软件有限公司，从事移动核心网络建设和优化以及系统集成业务。在原单位四川中移通信技术工程有限公司工作期间连年获取先进个人、高级管理师等荣誉。工作中积累了丰富的技术方案和项目实施经验，特别是在大数据平台和视觉计算方面，为公司提供了高效的技术支持和解决方案，为公司大数据行业的发展做出了积极的贡献。