ChatGPT – це велика мовна модель, яка може генерувати текст, перекладати мови, писати різні види творчого контенту та інформативно відповідати на запитання. Однак, незважаючи на те, що вона прочитала майже весь інтернет, ChatGPT все ще не може міркувати, як людина, і часто робить помилки, пов’язані з різноманіттям.
У дослідженні, проведеному доктором Веред Шварцем, доцентом кафедри комп’ютерних наук Університету Британської Колумбії, і магістранткою Мехар Бхатія, було виявлено, що ChatGPT, як і інші великі мовні моделі, має тенденцію до упереджень, пов’язаних із культурою. Наприклад, коли модель була показана зображенням жінки в Сомалі, яка робить татуювання хною, вона припустила, що вона хоче купити хну, а не готується до весілля, як це є традицією в Сомалі.
У іншому прикладі, коли моделі було запропоновано гіпотетичну ситуацію, в якій пара залишила чотири відсотки чайових у ресторані в Іспанії, вона припустила, що вони, можливо, були незадоволені обслуговуванням. Це припускає, що в Іспанії діє північноамериканська культура чайових, хоча насправді чайові не є поширеним явищем у цій країні і чотири відсотки чайових, швидше за все, означають виняткове обслуговування.
Шварц і Бхатія стверджують, що для того, щоб великі мовні моделі були більш точними та інклюзивними, їх потрібно навчати на даних з різних культур. Це допоможе моделям зрозуміти різні культурні норми та цінності, а також уникнути упереджень. “Мовні моделі поширені повсюдно, – каже Шварц. – Якщо ці моделі припускають набір цінностей і норм, пов’язаних із західною або північноамериканською культурою, їхня інформація для людей з інших культур і про них може бути неточною і дискримінаційною”.
“Ми хочемо, щоб цими інструментами могли користуватися всі, а не лише одна група людей”, – додає Бхатія. “Канада – культурно різноманітна країна, і ми повинні переконатися, що інструменти штучного інтелекту, які керують нашим життям, не відображають лише одну культуру та її норми”.
Дослідження Шварц і Бхатія є важливим кроком у напрямку створення більш інклюзивних мовних моделей. Однак для того, щоб досягти цього, необхідно, щоб розробники та дослідники продовжували працювати над створенням наборів даних, які відображають різноманіття людських культур.








