Кто пишет: Тарас Евич, маркетолог с 15+ годами опыта. Работал в Megatop, 7 Карат, А-100, Respect, Belbohemia, Kann. Сотрудничал с Lay’s, Purina. Владелец небольшого маркетингового аутсорса, а также основатель проекта AllBook.
Итак, о чем же AllBook?
Это приложение, которое позволяет детям лучше воспринимать тексты книг. В приложении будет несколько основных функций:
- мгновенное создание картинок и иллюстраций;
- создание аудиоверсий книги;
- создание ваших собственных сказок и историй;
- чтение по ролям с помощью ИИ.
Они будут реализованы с помощью разных нейросетей. Все они готовы предоставить свои мощности. Наш ближайший конкурент — NaturalReader. Это предложение преображает текст в голос на разные языки мира (более миллиона установок). Идентичного приложения пока, к счастью, нет.
Проектом заинтересовались в PocketBook
Как только меня посетила идея проект и придумался концепт, я сразу же сделал рендеры девайса в 3d. Подготовил презентацию для продажи. Проверил следующие гипотезы:
- Интересно кому-то кроме меня?
- Реализуемо?
Подготовил список всех известных нейронок, разделил их на сегменты и начал связываться. Одними из первых откликнулись ребята из leonardo.ai (австралийский проект ИИ для генерации графического и анимированного контента). Со мной на связь вышел их коммерческий директор.
Я презентовал ему проект. Его ответ — помимо возможности реализации задуманного функционала с ними, он готов рассмотреть покупку доли в проекте после выхода MVP.
Ещё я связался со всеми известными производителями электронных книг. Первыми на мой клич откликнулись ребята из PocketBook. Они готовы купить MVP и посоветовали выпустить мобильное приложение с таким функционалом, которое можно добавить в прошивку их книг.
Как будет зарабатывать проект
Модель монетизации будет комбинированная.
B2C — платная ежемесячная подписка.
- бесплатная: работает только генерация изображений. Лимит — 10 изображений в неделю. Бесплатный период: 1 календарная неделя;
- платная подписка «All»: доступна одна функция генерации. По ней неограниченное количество раз генерации в рамках календарного периода. Можно купить как помесячную, так и годовую;
- платная подписка «All+». Доступны все функции без ограничений;
- онлайн магазин книг от издательств и онлайн-маркетов книг.
B2B
- можно презентоваць книги в мобильном приложении;
- брендирование приложения.
В чём ценность проекта
Исследования показывают, что дети до показа иллюстраций воспроизводят текст в среднем на 25%, а после показа иллюстраций — 40-45%. Визуалы в книгах позволяет детям легче и быстрее строить ассоциативно-смысловые связи между звуком (чтение вслух), смыслом и изображением.
Когда ребенок начинает понимать смысл слов, которые слышит в процессе чтения, то истории, которые рассказывают родители, приобретают значение.
Появляется уникальная возможность познавать мир, находясь у себя в комнате. Не у каждой детской книги есть картинки, и точно не по каждой главе или сцене. Есть много классных молодых авторов, у которых нет денег на книгу с качественными иллюстрациями. Наш проект поможет «оживить» и такие книги.
Мы целимся не только на аудиторию родителей и их детей, но и на школьников, студентов, сценаристов, писателей. Всем, кому важно образное восприятие материала при его изучении или создании.
Возможность создать по рисунку текстовое произведение, в корне отличает нас от существующих игроков на рынке.
Ищу крутого технического специалиста
Я очень и очень ищу себе партнера — толкового CTO с успешными практическими кейсами, со знанием работы современных нейронок. И инвестора/соинвестора. Я отлично продаю, но у меня слабая техническая экспертиза.
Возможно вообще сработает теория 6 рукопожатий: кто-то прочтет и подскажет знакомому, который ищет для себя проект.
Однако я далек от ИТ-сферы и поэтому буду искренне рад любой помощи, консультации или участию. Верю, что AllBook будет востребованным и полезным.
Хотите посотрудничать? Пишите в телеграм.
Мнение автора может не совпадать с позицией редакции.
Что ещё почитать про беларусские стартапы:
- Беларус создал проект, который делает кардиограмму телефоном. Его уже рекомендуют врачи в Англии;
- Работали в прибыль, отказались от дейликов. CEO ScootAPI рассказывает, как дела у стартапа;
- Как создать успешное приложение для здоровья: 5 советов от CPO в Gismart.
Релоцировались? Теперь вы можете комментировать без верификации аккаунта.
А зачем девайс для чего-то, что полностью софтверное? Почему просто не сделать приложение на телефоны и планшеты?
Про генерацию картинок на лету. У меня есть приложение, которое делает что-то похожее для ресторанных меню. Сфотографировал и чатишься, можешь попросить визуализировать какие-то блюда. Результаты временами шокирующие. Иногда оно (OpenAI Vision) рисует вполне себе фотореалистичные и адекватные вещи. Иногда выдает абстракции, где пармезан парит на фоне галактик. Или доисторических людей, жарящих мамонта на вертеле. И почти никогда не может выдать нужное количество пальцев. Еще, очень трудно уговорить нейронку рисовать только блюда из меню и ничего больше. Но, возможно, если вы нанимаете компанию, специализирующуюся на генерации картинок, у них найдется что-то более надежное.
Как вы собираетесь решать проблему копирайта? Планируете договариваться с авторами книг?
Приветствую. Мы по сути сейчас и хотим сосредоточиться именно на софтине для мобильных. Девайс потом. Касательно багов при генерации картинок - Вы правы, мы именно и заручились поддержкой профильных нейронок в лице их руководства, чтобы не самим обучать с нуля, а воспользоваться наиболее толковыми и прокачанными решениями.
По проблемам копирайта: вопрос решен. Это также сила нашего бэкофиса: вопросов по авторству не будет, за исключением книг, выставленных на прродажу, через нашу аппку
Сори, не смог удержаться.
Лол 1. "самим обучать с нуля" - это равносильно заявлению самим запускать спутники на орбиту. Сейчас с нуля никто уже ничего не обучает, толко если вы не условный OpenAI c тоннами бабла инвесторов. Без бабла стартапу "самим" можно обучить +- успешно только хотдог/не хотдог распознавать.
Лол 2. "заручились поддержкой профильных нейронок в лице их руководства" - а ну если заручились поддержкой прям руководства прям профильных нейронок, то конечно будет 100% гарантия качества инференса. Там по-другому и быть не может. А у всех остальных у кого пармезан парит на фоне галактик - там просто не заручились поддержкой профильных нейронок и их руководства. Так что бегом, заручаться :)
Лол 3. И про копирайт.. OpenAI/Microsoft бомбят все кому не лень за различные нарушение авторских прав тоже просто потому, что у них слабый бэкофис. Это же очевидно.
А так да, удачи. Идея конечно прикольная, но девайс 100% лишнее.
Згенераваць малюнкі па тэкставаму апісанню зараз не занадта цяжкая задача, а вось зрабіць іх кансістэнтнымі, каб, калі адзін персанаж які з'яўляецца ў главах 3-яй і 8-ай, то ён павінен выглядаць аднолькава - гэта цікавая задача.
Персонаж, окружение и весь контекст. Я боюсь представить размеры моделей и мощности чтобы держать «в уме» всю книгу для генерации каждому пользователем. Если автор это сделает - openai можно посыпать голову пеплом и закрываться.
Пользователь отредактировал комментарий 04 июля 2024, 14:30
Да вы как-то переусложняете. Да, было бы хорошо держать "в уме" всю книгу, но можно попробовать обойтись только небольшим куском. Остальное сложить в векторную базу и объяснить ЭйАй, как ей пользоваться. Он будет делать описание будущей картинки по текущему куску книги и ходить за деталями в базу. Это вполне может сработать. Генерилки картинок обычно разрешают загрузить одно или несколько изображений, чтобы брать их за основу. Можно грузить прошлые картинки или заранее сгенерить, например, основных персонажей. Это даст какую-то консистентность. В общем, можно пробовать и без команды ученых.
Ну, и там уже на подходе модели, создающие видео по тексту. Мне кажется, скоро мы увидим много подобных стартапов.
Это потому, что иллюстратор - не просто несколько мазков на тему абзаца, а сюжет сквозь всё произведение. Как уже отметили выше, современные нейронки очень далеки от этого. И ИМХО не будет на это способны ещё очень долго - это не нагенерить псевдонаучную лапшу на заданную тему.
А вообще сумбурно всё. Произведение по картинке, картинка по произведению... Это две разные совершенно задачи и целевые аудитории, кому это могло бы быть нужно совершенно разные. Зачем это лепить в одну кучу - не понятно.
Но в целом посыл у автора верный: побольше якорных слов типа нейронка и AI, сумбурных идей и инвесторы потянутся. Предлагаю расставить сети шире, не только ленивым писателям нужно делать текст по картинке, сейчас развелось много психологов, предложите инвесторам тему healthcare - это же будет чудесно, когда по наброску пациента сеть напишет рассказ на тему как детские травмы привели его в этот кабинет и будет генерирь ему мотивационные тексты по подписке.
идея трэшовая
платить за генерацию картинок уровня "как повезет" тоже весьма сомнительная затея
учитывая, какой трэш иногда генерят сеточки, "тестировать" это на своих детях - верх безумия
Проблемы, которые придется решить, они намного глобальнее чем сама прикладная задача. И задача эта перетягивает денежное одеяло на себя от иллюстраторов издателей полиграфистов и т.д. А если проблемы будут решены, то все они тоже будут использовать такое решение для упрощения своей работы, притом они ещё и доработают результат, чего ваша приложенька будет лишена. А вдруг она член для ребенка нагенерит там, такое не прокатит и будет караться как юридические так и репутационно.
В общем из пушки по воробьям