===
Само-согласование (Self-Consistency) Само-согласование- одна из самых продвинутых техник в инженерии промптов. Этот метод, предложенный Wang и соавторами в 2022 году, призван улучшить процесс декодирования, используемый в запросах с цепочкой рассуждений (Chain-of-Thought, CoT). Суть метода: 1. Получение нескольких вариантов рассуждений с помощью запросов CoT с несколькими примерами. 2. Выбор наиболее согласованного ответа из полученных вариантов. Этот подход повышает эффективность CoT в задачах, связанных с арифметикой и логическими рассуждениями. Давайте рассмотрим пример: Задача: Когда мне было 6 лет, моя сестра была вдвое младше меня. Сейчас мне 70 лет, сколько лет моей сестре? Простой ответ модели: 35-
Этот ответ неверный. Попробуем применить метод самосогласованности. Для этого используем промпт с несколькими примерами из работы Wang и соавторов (2022). Вот несколько примеров из этого запроса: В: В роще 15 деревьев. Работники посадят сегодня деревья. После этого в роще будет 21 дерево. Сколько деревьев посадили работники? О: Изначально 15 деревьев. В конце 21 дерево. Разница - это количество посаженных деревьев. 21 - 15 = 6 деревьев. Ответ: 6. В: На парковке 3 машины. Приезжают еще 2 машины. Сколько машин на парковке? О: На парковке 3 машины. Приезжают еще 2. Теперь там 3 + 2 = 5 машин. Ответ: 5. [еще несколько примеров] В: Когда мне было 6 лет, моя сестра была вдвое младше меня. Сейчас мне 70 лет, сколько лет моей сестре? О: После этого промпта модель генерирует несколько вариантов ответа: Вариант 1: Когда мне было 6 лет, сестре было 3 года (вдвое младше). Сейчас мне 70 лет, значит ей 70 - 3 = 67 лет. Ответ: 67. Вариант 2: Когда рассказчику было 6 лет, сестре было 3 года (вдвое младше). Теперь рассказчику 70 лет, значит сестре 70 - 3 = 67 лет. Ответ: 67. Вариант 3: Когда мне было 6 лет, сестре было 3 года (вдвое младше). Сейчас мне 70 лет, значит ей 70/2 = 35 лет. Ответ: 35. Полный процесс выбора окончательного ответа включает несколько этапов (детали можно найти в оригинальной статье). Но даже на этом этапе видно, что два из трех ответов совпадают. Этот "ответ большинства" и станет итоговым результатом. Таким образом, метод самосогласованности позволяет получить более надежный ответ, учитывая несколько вариантов рассуждений.===