机读格式显示(MARC)
- 000 01426nam0 2200313 450
- 010 __ |a 978-7-121-47531-3 |d CNY118.00
- 100 __ |a 20240821d2024 em y0chiy50 ea
- 200 1_ |a 视觉问答 |A shi jue wen da |d Visual question answering |e 理论与实践 |e from theory to application |f 吴琦[等]著 |g 王鑫,聂婕,朱文武译 |z eng
- 210 __ |a 北京 |c 电子工业出版社 |d 2024
- 215 __ |a 17,223页 |c 图 |d 24cm
- 304 __ |a 著者还有:王鹏、王鑫、何晓冬、朱文武
- 305 __ |a Springer Nature Singapore Pte Ltd.授权出版
- 330 __ |a 本书共5部分,第1部分介绍在计算机视觉和自然语言处理领域广泛使用的基本方法和技术;第2部分将图像视觉问答进一步分为五类,即联合嵌入、注意力机制、记忆网络、组合推理和图神经网络;第3部分讨论基于视频的视觉问答及其相关模型。第4部分讨论与视觉问答相关的高级任务,包括具身视觉问答、医学视觉问答、基于文本的视觉问答等;第5部分对该领域进行总结和展望,讨论视觉问答领域的未来研究方向。
- 510 1_ |a Visual question answering |e from theory to application |z eng
- 606 0_ |a 计算机视觉 |A Ji Suan Ji Shi Jue |x 图象处理 |j 问题解答
- 701 _0 |a 吴琦 |A wu qi |4 著
- 702 _0 |a 王鑫 |A wang xin |4 译
- 702 _0 |a 聂婕 |A nie jie |4 译
- 702 _0 |a 朱文武9zhu wen wu |A zhu wen wu 9zhu wen wu |4 译
- 801 _0 |a CN |b HDUL |c 20241015
- 905 __ |a HDUL |d TP391.413/610