Robotics

Robots Now ‘understand’ Social Cues to Navigate Crowded Spaces Smoothly

by Rohail T.February 26, 2026
Quantum Algorithms

Models Now Generate Charts with Improved Structure and Consistency, Achieving 61.7% Accuracy

by Rohail T.February 13, 2026
Artificial Intelligence

AI Learns from Images and Text to Make More Reliable Predictions

by Rohail T.February 10, 2026
Quantum Hardware

AI Vision Improves As Image and Text Understanding Become More Consistent

by Rohail T.February 10, 2026
Quantum Research News

AI ‘molecular Editor’ Reshapes Molecules with Human-Level Precision and Control

by Rohail T.February 10, 2026
Technology

Vtc-R1 Achieves 3.4x Reasoning Speed-Up with Vision-Text Compression

by Rohail T.February 3, 2026
Space

Multi-Agent Robotic System Challenge Advances Embodied AI Planning and Control

by Rohail T.January 28, 2026
Machine Learning

Devprompt Achieves One-Normal Shot Image Anomaly Detection with Deviation Guidance

by Rohail T.January 28, 2026
Space

Marscope Achieves 0.978 F1 Score for Natural Language Martian Landform Mapping

by Rohail T.January 27, 2026
Artificial Intelligence

Iterative Refinement Achieves 41.3% Better Compositional Image Generation Results

by Rohail T.January 24, 2026
Artificial Intelligence

Haven Achieves 84.1% Long Video Understanding with Audiovisual Entity Cohesion

by Rohail T.January 23, 2026
Machine Learning

Vlm-based Approaches Achieve Zero-Defect Anomaly Classification and Segmentation

by Rohail T.January 21, 2026
Artificial Intelligence

Deep Vision-Language Fusion Achieves Comprehensive Alignment with Dynamic Cross-Layer Injection

by Rohail T.January 20, 2026
Artificial Intelligence

Visil Achieves Unified Evaluation of Information Loss in Multimodal Video Captioning

by Rohail T.January 19, 2026
Machine Learning

Vision-language Alignment Achieves 5% Precision Gains with Multi-Agent Cooperative Learning

by Rohail T.January 19, 2026
Artificial Intelligence

Pathfound Achieves Advanced Pathological Diagnosis through Agentic Multimodal Evidence Seeking

by Rohail T.January 7, 2026
Artificial Intelligence

Slidechain Enables Semantic Verification of Educational Content with Blockchain Registration

by Rohail T.January 7, 2026
Artificial Intelligence

Visualactbench: Evaluation of 29 VLMs on 1,074 Videos Reveals Gap in Human-Aligned Reasoning and Action

by Rohail T.December 12, 2025
Artificial Intelligence

Be My Eyes: Multi-Agent Collaboration Extends Large Language Models to New Modalities through Vision

by Rohail T.November 26, 2025
Artificial Intelligence

Video-as-answer: Joint-GRPO Predicts Next Video Event, Extending Answers Beyond Text for Procedural Learning

by Rohail T.November 24, 2025
Artificial Intelligence

Visplay: Self-Evolving Vision-Language Models Autonomously Improve Reasoning with Unlabeled Image Data

by Rohail T.November 21, 2025
Artificial Intelligence

Vision Large Language Models Handle Noise, Improving Engagement Analysis with 0.22 and 0.06 Reliability Gains

by Rohail T.November 20, 2025
Artificial Intelligence

Training-free IC-Light Extension Enables Text-Guided Relighting of 3D Gaussian Splatting Scenes

by Rohail T.November 19, 2025
Emerging Technology

Scitextures Dataset Connects 100,000 Images of Visual Patterns, Models and Code across Science and Art

by Rohail T.November 17, 2025
Artificial Intelligence

Vision Language Models As Closed-Loop Symbolic Planners Improve Robotic Control through Control-Theoretic Insights

by Rohail T.November 13, 2025
Artificial Intelligence

Glyph: Visual-Text Compression Scales LLM Context Windows, Achieving 4x Compression with Vision-Language Models

by Rohail T.October 24, 2025
Artificial Intelligence

See, Point, Fly: Training-Free VLM Framework Enables Universal UAV Navigation Via 2D Spatial Grounding

by Rohail T.October 2, 2025
Artificial Intelligence

Caprl: Reinforcement Learning Stimulates Dense Image Caption Capabilities, Overcoming Limitations of Supervised Fine-Tuning

by Rohail T.October 2, 2025
Artificial Intelligence, Quantum Research News

Drishtikon Benchmark, with 64,000 Multilingual Text-Image Pairs, Evaluates Cultural Understanding in Language Models

by Rohail T.September 26, 2025
Artificial Intelligence

Reward Scaling Achieves Breakthrough in Visual Generation Quality

by Quantum NewsSeptember 12, 2025
Artificial Intelligence

Researchers At DeepMind Develop VoCap for Promptable Video Object Segmentation and Detailed Captioning with Masks

by Quantum NewsSeptember 1, 2025
Artificial Intelligence

Circuit Analysis Reveals Localised Visual Semantics in Large Vision-Language Models

by The NeuronJuly 29, 2025
Artificial Intelligence

Aerial-Ground Robots Combine AI for Robust Task Coordination in Complex Environments.

by Quantum NewsJune 7, 2025
Artificial Intelligence

AI Agent Creates Realistic 3D Avatars From Single Images or Text.

by Quantum NewsJune 7, 2025
Artificial Intelligence

AI Emulates Artistic Photo Retouching with Reasoning and Transparent Control.

by The NeuronJune 2, 2025
Artificial Intelligence

New Hybrid AI Tool Generates High-Quality Images 9X Faster Than State-Of-The-Art Approaches

by Quantum NewsMarch 20, 2025
Artificial Intelligence

Gemma 3 Unveiled: Multimodal AI With Longer Context Windows And Improved Capabilities

by Quantum NewsMarch 13, 2025
Artificial Intelligence

AI Models Learn to Forget Unnecessary Information Efficiently

by Quantum NewsDecember 10, 2024
Artificial Intelligence

High-Performance Chinese Language Models Built on Quality Data and Advanced Engineering

by Quantum NewsMarch 10, 2024