Глубокое обучение с подкреплением. AlphaGo и другие технологии

Глубокое обучение с подкреплением. AlphaGo и другие технологии

Рекомендательный сервис

  • Общий рейтинг 4.09
  • Рейтинг покупателей 3.91
  • Рейтинг экспертов 4.60
  • Качество материалов 4.91
  • Надежность 4.00
  • Простота в использовании 4.16
  • Ремонтопригодность 4.79
  • Эффективность выполнения своих функций 4.79
  • Коэффициент удивления "Вау!" 4.09
  • Безопасность для пользователя4.10
  • Внешний вид 4.96
  • Удобство в уходе и чистке 4.17
  • Экологическая безопасность 4.62
  • Гарантия на товар 4.11
  • Соответствие стандартам качества 4.06
  • Инновационные технологии 4.10
  • Хит продаж 4.09
  • Скорость морального устаревания 4.97
  • Энергоэффективность 4.76
  • Универсальность использования 4.90
  • Наличие дополнительных функций 4.12
  • Соотношение цена-качество 3.61
  • Практичность и удобство хранения 4.90
  • Стабильность работы в различных условиях 4.21
  • Возможность персонализации 4.00
  • Ликвидность 4.70
  • Индекс рекомендаций 3.11
Эта книга — подробное руководство по новейшим инструментам глубокого обучения с подкреплением и их ограничениям. Мы реализуем и проверим на практике методы кросс-энтропии и итерации по ценностям (Q-learning), а также градиенты по стратегиям. Для экспериментов используются самые разные среды обучения с подкреплением (RL), начиная с классических CartPole и GridWorld и заканчивая эмуляторами Atari и средами непрерывного управления (на основе PyBullet и RoboSchool). Множество примеров основано на нестандартных средах, в которых мы с нуля разработаем модель окружения. В этой книге: - Вы узнаете, какое место в контексте глубокого обучения занимают методы RL, реализуете сложные модели глубокого обучения. - Изучите основу RL: марковские процессы принятия решений. - Рассмотрите примеры реализации методов RL: метод кросс-энтропии, DQN, A3C, TRPO, PPO, DDPG, D4PG и других. - Узнаете, как работать с дискретными и непрерывными пространствами действий в различных средах. - Увидите, как разработать систему, обучающуюся играм Atari, используя обучение с подкреплением. - Создадите собственную среду по модели OpenAI Gym для обучения биржевого агента. - Реализуете метод AlphaGo Zero для игры в Connect4. - Познакомитесь с применением RL в обработке речи: узнаете, как обучить диалогового бота на фразах из кинофильмов.
Информация о характеристиках, комплекте поставки, стране изготовления, внешнем виде и цвете товара носит справочный характер и взятая из открытых источников.
Глубокое обучение с подкреплением. AlphaGo и другие технологии продается в интернет-магазине Сима Ленд
Эксперт: Святослав В., товарный критик
Дата рецензии: 24 ноября 2025 года
Рекомендация к покупке нейтральная

Отзывы о товаре

Спасибо Ваш отзыв будет опубликован после проверки модераторами.
Добавить отзыв

Доставка покупки

    • Курьерской службой;
    • Самовывоз из пунктов выдачи;
    • Почтой России;
    • Транспортными компаниями.

Оплата заказа

    • Наличными при получении;
    • Банковской картой;
    • Банковским переводом.
  • Наименование: ООО "СИМАМАРТ"
  • ИНН: 6679072060

Предложения других продавцов

Часто задаваемые вопросы

Оплатить покупку возможно банковскими картами, банковским переводом, наличными при получении. Перечень всех способов оплаты доступен при оформлении заказа.
Да, в соответствии с законом «О защите прав потребителей» вы можете вернуть товар надлежащего качества в течение 14 дней с момента покупки, если он не был в употреблении, сохранены упаковка, ярлыки и товарный вид, и при этом не входит в перечень товаров, не подлежащих возврату или обмену (утверждённый Постановлением Правительства РФ №55).
На большинство товаров предоставляется гарантия от производителя. Срок гарантии указан в описании товара.

Рекомендуем аналогичные товары

Дополнительно из категории