Παρυφές

Ποιός εκπαιδεύει τα μοντέλα;

HPV vaccination rates in the United States remain substantially below target levels. We conducted a randomized controlled trial (N = 1,124 vaccine-hesitant participants) comparing personalized dialogues with an AI model (GPT-4 Turbo) instructed to address HPV vaccination concerns to both a control condition and a CDC brochure about the vaccine. We document notable pre-treatment variation in the concerns participants raised about HPV vaccination. Examining treatment effects, the human-AI dialogue was more than twice as effective as the CDC brochure at increasing vaccination intentions for both daughters and sons relative to the control.

O Andrew Dessler σημειώνει στο Climate Brink ότι τα LLMs μπορούν να πείσουν ανθρώπους να πάρουν κοινωνικά επωφελείς αποφάσεις, αναφέροντας ως παράδειγμα το paper από το οποίο το παραπάνω απόσπασμα.

Από την άλλη παρατηρεί ότι ανάλογα του πώς έχουν εκπαιδευτεί τα μοντέλα δίνουν και διαφορετικές απαντήσεις σε αντιμαχόμενα θέματα, όπως η κλιματική αλλαγή. Για παράδειγμα, ενώ το Grok 2 αξιολογούσε την κλιματική αλλαγή ως «επείγουσα απειλή», το Grok 3 προσπαθεί να δει και τις δύο όψεις του νομίσματος.

I’ve asked a large number of different LLMs and they all give answers like Grok 2. Grok 3 is the outlier and I therefore conclude that it was specifically programmed to give this “both sides” response that counterbalances well established science with easily debunked denier talking points (“we’ll adapt”, “very small economic costs”, etc.).

The bottom line from this exercise is that you should be skeptical what LLMs tell you about important political questions. The majority of LLMs answer this correctly, but it’s clear that LLMs can be manipulated to advance the political objectives of the LLM’s owner.

Συμπέρασμα ίσως προφανές αλλά με τη χρήση των chatbots ολοένα αυξανόμενη δεν είναι καθόλου απίθανο να έχουν επιρροή ανάλογη των ΜΜΕ ή των κοινωνικών δικτύων στο σύντομο μέλλον.