arXivDaily每日学术速递，同步arXiv全量数据，AI总结、翻译，覆盖人工智能、机器人、计算机、金融、统计学、数学、物理学、生物学、经济学、电气&系统等方向。

2511.17813 2026-03-17 cs.CL cs.AI cs.LG cs.SD

Point of Order: Action-Aware LLM Persona Modeling for Realistic Civic Simulation

Scott Merrill, Shashank Srivastava

Comments 8 pages (32 pages including appendix), 18 figures. Code and datasets are available at https://github.com/smerrillunc/action-aware-llms. Submitted to ACL 2026

2511.17133 2026-03-17 cs.CV

Off the Planckian Locus: Using 2D Chromaticity to Improve In-Camera Color

SaiKiran Tedla, Joshua E. Little, Hakki Can Karaimer, Michael S. Brown

Comments Project page: https://cst-mlp.github.io

2511.12207 2026-03-17 cs.CV

Mixture of States: Routing Token-Level Dynamics for Multimodal Generation

Haozhe Liu, Ding Liu, Mingchen Zhuge, Zijian Zhou, Tian Xie, Sen He, Yukang Yang, Shuming Liu, Yuren Cong, Jiadong Guo, Hongyu Xu, Ke Xu, Kam-Woh Ng, Juan C. Pérez, Juan-Manuel Pérez-Rúa, Tao Xiang, Wei Liu, Shikun Liu, Jürgen Schmidhuber

Comments Accepted to CVPR 2026; Homepage: https://haozheliu-st.github.io/mos-homepage/

2511.11878 2026-03-17 cs.CL

MedPT: A Massive Medical Question Answering Dataset for Brazilian-Portuguese Speakers

Fernanda Bufon Färber, Iago Alves Brito, Julia Soares Dollis, Pedro Schindler Freire Brasil Ribeiro, Rafael Teixeira Sousa, Arlindo Rodrigues Galvão Filho

Comments Accepted at LREC 2026, 11 pages, 3 tables, 2 figures

2511.11301 2026-03-17 cs.AI

EcoAlign: An Economically Rational Framework for Efficient LVLM Alignment

Ruoxi Cheng, Haoxuan Ma, Teng Ma, Hongyi Zhang

2511.10979 2026-03-17 cs.CV cs.AI

PAS: A Training-Free Stabilizer for Temporal Encoding in Video LLMs

Bowen Sun, Yujun Cai, Ming-Hsuan Yang, Hang Wu, Yiwei Wang

2511.09677 2026-03-17 cs.LG stat.ML

Boosted GFlowNets: Improving Exploration via Sequential Learning

Pedro Dall'Antonia, Tiago da Silva, Daniel Augusto de Souza, César Lincoln C. Mattos, Diego Mesquita

Comments 11 pages, 3 figures (22 pages total including supplementary material)

2511.07112 2026-03-17 cs.CL cs.AI

ML-EcoLyzer: Quantifying the Environmental Cost of Machine Learning Inference Across Frameworks and Hardware

Jose Marie Antonio Minoza, Rex Gregor Laylo, Christian F Villarin, Sebastian C. Ibanez

2511.06348 2026-03-17 cs.CV cs.AI

GazeVLM: A Vision-Language Model for Multi-Task Gaze Understanding

Athul M. Mathew, Haithem Hermassi, Thariq Khalid, Arshad Ali Khan

2511.05791 2026-03-17 cs.RO cs.AI cs.LG

VLAD-Grasp: Zero-shot Grasp Detection via Vision-Language Models

Manav Kulshrestha, S. Talha Bukhari, Damon Conover, Aniket Bera

Comments 8 pages, 4 figures, under review

2511.04161 2026-03-17 cs.CV cs.CL

Seeing Straight: Document Orientation Detection for Efficient OCR

Suranjan Goswami, Abhinav Ravi, Raja Kolla, Ali Faraz, Shaharukh Khan, Akash, Chandra Khatri, Shubham Agarwal

2511.03571 2026-03-17 cs.RO cs.CV eess.IV

OneOcc: Semantic Occupancy Prediction for Legged Robots with a Single Panoramic Camera

Hao Shi, Ze Wang, Shangwei Guo, Mengfei Duan, Song Wang, Teng Chen, Kailun Yang, Lin Wang, Kaiwei Wang

Comments Accepted to CVPR 2026. Datasets and code will be publicly available at https://github.com/MasterHow/OneOcc

2511.01237 2026-03-17 cs.CV cs.AI

Eyes on Target: Gaze-Aware Object Detection in Egocentric Video

Vishakha Lall, Yisi Liu

2510.21758 2026-03-17 cs.RO cs.LG

Taxonomy and Trends in Reinforcement Learning for Robotics and Control Systems: A Structured Review

Kumater Ter, Abolanle Adetifa, Daniel Udekwe

2510.18269 2026-03-17 cs.CV cs.AI

StreamingTOM: Streaming Token Compression for Efficient Video Understanding

Xueyi Chen, Keda Tao, Kele Shao, Huan Wang

Comments Accepted at CVPR 2026. Project page: https://yige24.github.io/StreamingTOM

2510.16917 2026-03-17 cs.SD cs.AI cs.CL eess.AS

SAKE: Towards Editing Auditory Attribute Knowledge of Large Audio-Language Models

Chih-Kai Yang, Yen-Ting Piao, Tzu-Wen Hsu, Szu-Wei Fu, Zhehuai Chen, Ke-Han Lu, Sung-Feng Huang, Chao-Han Huck Yang, Yu-Chiang Frank Wang, Yun-Nung Chen, Hung-yi Lee

Comments Work in progress. Resources: https://github.com/ckyang1124/SAKE

2510.14018 2026-03-17 cs.RO

Spatially Intelligent Patrol Routes for Concealed Emitter Localization by Robot Swarms

Adam Morris, Timothy Pelham, Edmund R. Hunt

详情

DOI: 10.1109/SSRR68451.2025.11391260
Journal ref: 2025 IEEE International Symposium on Safety Security Rescue Robotics (SSRR)

英文摘要

This paper introduces a method for designing spatially intelligent robot swarm behaviors to localize concealed radio emitters. We use differential evolution to generate geometric patrol routes that localize unknown signals independently of emitter parameters, a key challenge in electromagnetic surveillance. Patrol shape and antenna type are shown to influence information gain, which in turn determines the effective triangulation coverage. We simulate a four-robot swarm across eight configurations, assigning pre-generated patrol routes based on a specified patrol shape and sensing capability (antenna type: omnidirectional or directional). An emitter is placed within the map for each trial, with randomized position, transmission power and frequency. Results show that omnidirectional localization success rates are driven primarily by source location rather than signal properties, with failures occurring most often when sources are placed in peripheral areas of the map. Directional antennas are able to overcome this limitation due to their higher gain and directivity, with an average detection success rate of 98.75% compared to 80.25% for omnidirectional. Average localization errors range from 1.01-1.30 m for directional sensing and 1.67-1.90 m for omnidirectional sensing; while directional sensing also benefits from shorter patrol edges. These results demonstrate that a swarm's ability to predict electromagnetic phenomena is directly dependent on its physical interaction with the environment. Consequently, spatial intelligence, realized here through optimized patrol routes and antenna selection, is a critical design consideration for effective robotic surveillance.

URL PDF HTML ☆

赞 0 踩 0

2510.13884 2026-03-17 cs.CL

Too Open for Opinion? Embracing Open-Endedness in Large Language Models for Social Simulation

Bolei Ma, Yong Cao, Indira Sen, Anna-Carolina Haensch, Frauke Kreuter, Barbara Plank, Daniel Hershcovich

Comments EACL 2026

2510.13212 2026-03-17 cs.LG

Towards Understanding Valuable Preference Data for Large Language Model Alignment

Zizhuo Zhang, Qizhou Wang, Shanshan Ye, Jianing Zhu, Jiangchao Yao, Bo Han, Masashi Sugiyama

Comments Accepted by ICLR 2026

2510.09295 2026-03-17 cs.CL

MaP: A Unified Framework for Reliable Evaluation of Pre-training Dynamics

Jiapeng Wang, Changxin Tian, Kunlong Chen, Ziqi Liu, Jiaxin Mao, Wayne Xin Zhao, Zhiqiang Zhang, Jun Zhou

2510.08804 2026-03-17 cs.CL

MOSAIC: Multi-agent Orchestration for Task-Intelligent Scientific Coding

Siddeshwar Raghavan, Tanwi Mallick

Comments The paper requires a great deal of restructuring to be beneficial to the research community. We also identified some issues with the current experiments and improvements in LLM models which we want our work to reflect

2510.06107 2026-03-17 cs.CL cs.AI cs.CE

Distributional Semantics Tracing: A Framework for Explaining Hallucinations in Large Language Models

Gagan Bhatia, Somayajulu G Sripada, Kevin Allan, Jacobo Azcona

2510.03608 2026-03-17 cs.CV

Diffusion-Classifier Synergy: Reward-Aligned Learning via Mutual Boosting Loop for FSCIL

Ruitao Wu, Yifan Zhao, Guangyao Chen, Jia Li

Comments Accepted by NeurIPS 2025

2510.03592 2026-03-17 cs.LG cs.AI cs.MA cs.RO

Deep Reinforcement Learning for Multi-Agent Coordination

Kehinde O. Aina, Sehoon Ha

Comments 11 pages, 8 figures, 1 table, presented at SWARM 2022, to be published in Journal of Artificial Life and Robotics

2510.01485 2026-03-17 cs.RO cs.SY eess.SY

Pose Estimation of a Thruster-Driven Bioinspired Multi-Link Robot

Nicholas B. Andrews, Yanhao Yang, Sofya Akhetova, Kristi A. Morgansen, Ross L. Hatton

Comments 8 pages, 8 figures

2510.01478 2026-03-17 cs.CV cs.AI cs.LG

Purrception: Variational Flow Matching for Vector-Quantized Image Generation

Răzvan-Andrei Matişan, Vincent Tao Hu, Grigory Bartosh, Björn Ommer, Cees G. M. Snoek, Max Welling, Jan-Willem van de Meent, Mohammad Mahdi Derakhshani, Floor Eijkelboom

Comments Published as a conference paper at ICLR 2026

2510.01116 2026-03-17 cs.LG

Eliciting Chain-of-Thought Reasoning for Time Series Analysis using Reinforcement Learning

Felix Parker, Nimeesha Chan, Chi Zhang, Kimia Ghobadi

2510.01111 2026-03-17 cs.LG

TsLLM: Augmenting LLMs for General Time Series Understanding and Prediction