Learning to clarify: Multi-turn conversations with Action-Based Contrastive Self-Training

👤 Maximillian Chen, Research Scientist, Google Research, and Ruoxi Sun, Research Scientist, Google DeepMind
📅 2025-06-03

We propose Action-Based Contrastive Self-Training, a data-efficient contrastive reinforcement learning tuning approach for improved multi-turn conversation modeling in mixed-initiative … Full Product UX article at Google Research »

Fair use excerpts with source attribution for comment, news reporting and instructive commentary only. Original summary description and analysis by UXdesign.com’s authors. Original content © Google Research.

Google Research

Access UX News

Login or create an account to

Save as favorite
Upvote/downvote articles
Share via socials
Comment on articles
Submit an article

Product UX News Categories

UX News
- UX Trends
- UX With AI

Next UX News Fine-tuning LLMs with user-level differential privacy »

Product UX Design Collaborative

By Product UX Designers, for Product UX Designers.

For UX Pros

Product UX Design Jobs
UX Freelancer Listing
UX Consultant Listing
UX Agency Listing

Hire UX Pros

Post Product UX Jobs
Hire UX Design Freelancers
Hire UX Design Consultants
Hire UX Design Agencies

UX Industry News

UX Trends
UX Industry News
UX Career Trends
UX Leadership
UX Tools News

UX Events

UX Conferences 2026
UX Workshops
UX Webinars
UX Meetups

About UXDesign.com
Contact Us
Legal: Terms of Use | Privacy Policy | Cookie Policy