AllChat: Seamlessly Integrating AI into Your Workflow

In today’s rapidly evolving technological landscape, the integration of artificial intelligence (AI) into our daily tasks has become increasingly prevalent. AllChat is a cutting-edge application that seamlessly blends the power of AI with a user-friendly interface, enabling users to harness the capabilities of advanced language models like Gemini Pro 1.5 and others.

The journey of AllChat began with a vision to streamline the way we interact with AI, making it more accessible and intuitive for everyday use. Developed with a robust Node.js backend and a sleek React MUI frontend, AllChat offers a comprehensive suite of features designed to enhance productivity and simplify complex tasks.

At the heart of AllChat lies the Gemini Pro 1.5, a state-of-the-art language model renowned for its natural language processing capabilities. This powerful AI engine empowers users to engage in seamless conversations, ask questions, and receive intelligent responses tailored to their specific needs. But AllChat goes beyond basic conversational AI by incorporating a range of advanced features.

One of the standout features of AllChat is its multimodal input capabilities. Users can interact with the AI models not only through text but also through audio, video, and image inputs. This versatility ensures that AllChat can adapt to diverse communication preferences and scenarios, making it a truly inclusive platform.

In addition to the Gemini Pro 1.5, AllChat integrates with other cutting-edge AI models, including databricks/dbrx-instruct and mistralai/Mixtral-8x7B-Instruct-v0.1. This integration allows users to leverage the unique strengths and capabilities of each model, providing a comprehensive and versatile AI experience.

AllChat also excels in handling file uploads, supporting a wide range of document formats such as PDFs, Word documents, and Excel spreadsheets. Users can seamlessly incorporate these files into their conversations, enabling the AI models to process and analyze the content, thereby facilitating more informed and context-aware responses.

Markdown formatting support further enhances the user experience by allowing for structured and visually appealing text formatting within the conversations. This feature is particularly useful for developers, writers, and anyone who needs to communicate complex ideas or code snippets effectively.

One of the standout features of AllChat is its ability to generate and recognize images. Users can prompt the AI models to create visuals based on their descriptions, or they can upload existing images for analysis and interpretation by the models. This feature opens up a world of possibilities, from creative endeavors to visual data analysis.

AllChat also offers the ability to run Python code directly within the application. Users can leverage the AI models to generate code snippets or even entire programs, which can then be executed seamlessly. This feature is particularly valuable for developers, data scientists, and anyone working with computational tasks.

Moreover, AllChat allows users to call model functions, enabling advanced customization and tailored AI experiences. This feature empowers users to leverage the full potential of the integrated AI models, unlocking a world of possibilities for specialized tasks and workflows.

To ensure accessibility and convenience, AllChat is designed to be mobile-friendly, with support for Progressive Web Apps (PWAs) and dedicated Android applications. This cross-platform compatibility ensures that users can access the powerful AI capabilities of AllChat from virtually anywhere, enhancing productivity and fostering seamless integration into their daily routines.

One of the unique aspects of AllChat is its ability to connect the AI models to the real world through a suite of web tools. Users can effortlessly fetch real-time data, such as weather updates, stock prices, and news headlines, by simply asking the AI models. Additionally, AllChat enables users to automate email and Telegram correspondences, streamlining communication and information-sharing processes.

AllChat web tool integration extends beyond data retrieval and communication. Users can leverage the AI models to generate Python code on the fly, enabling them to perform complex computations, analyze data, and even create visualizations like graphs and images. This feature empowers users to tap into the vast potential of AI-driven automation and data processing.

To further enhance the user experience, AllChat offers a range of customization options. Users can provide their own API keys, ensuring seamless integration with their existing systems and services. Additionally, the application supports multiple chats, allowing users to manage separate conversations and contexts simultaneously.

AllChat commitment to transparency and community involvement is evident in its open-source approach. The project actively encourages users to contribute by suggesting new features, reporting issues, or even submitting code contributions through its GitHub repository and Discord channel.

In conclusion, AllChat is a remarkable achievement in the realm of AI integration, offering a comprehensive suite of features designed to streamline workflows, enhance productivity, and unlock the full potential of advanced language models. With its user-friendly interface, powerful backend, and seamless integration of cutting-edge AI technologies, AllChat is poised to revolutionize the way we interact with and leverage artificial intelligence in our daily lives.

Link to application: https://allchat.online/

Android: https://play.google.com/store/apps/details?id=online.allchat.twa

Automatic generation of comic videos by GPT-4

A multi-modal telegram bot I recently made was a resounding success 😊 I was surprised how many people took advantage of it and forked/liked it on github. But I wanted something more.

I decided to create a service where people can create their own comics, fairy tales, and indeed any stories. Preferably with the push of a button.

My idea was to create a program that could generate stories based on a small number of parameters. It was the language, the seed for generating text, the visual setting, and so on. I knew that for this I needed to use GPT-4, some kind of API for pictures, a translator, and a speech synthesizer. After a quick check, it turned out that all this is available and not so expensive!

The following picture popped into my head:

Prototype UI

Some technical points will be described below.

Images

I decided to use the good old Stable Diffusion, because it is cheap (even open source, but I use the API) and draws pretty well, but MidJourney is still closed.

I generate an image corresponding to the description of each step of the scene. In addition, I added various visual styles and settings to make the images more appealing and relevant to the context of the scene. For example, I used image styling in the style of Star Wars, Disney, Marvel, etc. All this is at the user’s choice.

As a result, I get a set of images in the same style, which are ready for video generation.

Recently, in one community, an almost brilliant idea was thrown – not to create pictures, but to google them on Google Pictures. It’s free, fast, and even better in some cases, like news. I will definitely implement.

Sound

When I first started working on the project, I ran into a problem – how to make it so that users can not only read, but also listen to the created stories?

And then the idea came to my mind to voice pieces of text through Google Text-to-Speech. It allows you to create realistic voice accompaniment in different languages ​​and with different voices.

You just need to break the text generated by GPT-4 into paragraphs and send each paragraph for voiceover. Thus, users can read the story and listen to the voiced version of it at the same time. This makes the reading process more interesting and fun, and also helps people who prefer to listen to text rather than read it.

Video

The most difficult part was building the story through videoshow.js. Quite a lot of time was spent on debugging all this. And here, for example, one of the resulting stories:

Globalization

The story generator is not tied to a language, it is completely global. In fact, in any language from the Google Text-2-Speech list .

So my plans include launching the US market, ProductHunt, Y Combinator and all that 😏 I would be glad for any support in this direction.

Features

  1. Share from Video: We have added a new feature that allows users to share videos directly from the video player. This feature makes it easier for users to share their content with their audience and promote their work.
  2. Search UI: We have redesigned the search interface on our platform, making it more intuitive and user-friendly. This update improves the overall user experience and helps users to find the content they are looking for more quickly.
  3. Order by Best 50 Newest 50 Interlaced: We have added a new sorting option that allows users to order their videos by the best 50, newest 50, or interlaced. This feature provides users with greater flexibility and control over how their content is organized.
  4. Fade Out 2 Seconds Before End Black Screen: We have introduced a new feature that fades out the video 2 seconds before the end and displays a black screen. This helps to create a more polished and professional finish to videos.
  5. Temperature Selection: We have added a new feature that allows users to adjust the temperature of their videos. This feature enables users to create unique visual effects and enhance the overall look and feel of their content.
  6. PWA + Apple Icon: We have added a progressive web app (PWA) to our platform, making it easier for users to access our services from their mobile devices. Additionally, we have added an Apple icon to improve the user experience on Apple devices.
  7. Show in Gallery First Stories in Browser Language, Filter by Language: We have added a new feature that shows the first stories in the gallery based on the user’s browser language. Additionally, we are exploring the possibility of adding a language filter to help users find content in their preferred language more easily.
  8. Android App: We have launched a new Android app for our platform, making it easier for users to create and upload videos from their mobile devices. This update improves the overall user experience and makes our platform more accessible to a wider audience. https://play.google.com/store/apps/details?id=shop.mangatv.twa&hl=en_US
  9. Show Subscription Date on Gold Plan: We have added a new feature that displays the subscription date for users on the Gold plan. This update provides users with more information about their subscription and helps them to manage their account more effectively.
  10. Vertical Videos (YouTube Shorts): We have added support for vertical videos (YouTube Shorts) to our platform, allowing users to create content for this popular format. This update enables our users to reach a wider audience and stay up-to-date with the latest trends in video creation.

Philosophical questions

Finally, the use of AI-generated content raises several philosophical questions. For example, what is the human role in creating and using such content? What are the ethical issues associated with using artificial intelligence to create content that can mimic the human mind and behavior? What is the future of AI-generated content creation and use, and how will this affect our culture and society as a whole? These questions require serious discussion and reflection so that we can make the most of the potential of artificial intelligence in our world.

But I decided to do it first, and then think about it 😊

Will the automatic content be of sufficient quality?

Today, there are algorithms that are able to create sufficiently high-quality texts, sound, and images. However, so far they cannot replace human creativity and create something completely new and original.

The story editing feature can help make the content better and more interesting. Editing allows you to improve and refine individual slides, correct errors, add new elements, and finally place emphasis. In addition, the editor can always make a creative contribution.

What do you think? Is the project interesting? Would you use? What monetization methods do you recommend?

You can see the project at this link

Or use this Android App: Manga TV

Как заработать миллион за пять дней с помощью Android

На Хабре часто встречаются статьи со сравнением доходности от разработки под iOS и Android. Обычно они заканчиваются тем, что под iOS разрабатывать в 10 раз выгоднее. С некоторых пор, мне смешно такое читать. Я поделюсь с вами небольшой историей взлета моего приложения (надеюсь, без последующего падения). Уверен, что под iOS ничего подобного не могло бы произойти.

Тип приложения

Конечно, это игра. Массовая, простая. Что еще можно сделать за 5 дней, работая исключительно по вечерам и в свое удовольствие? Возможно, кто-то зарабатывает на серьезных приложениях. Но вложения ресурсов в таких случаях будут в разы больше. Если вы решили делать игру, постарайтесь, чтобы она оказывала первое положительное впечатление хотя бы на 80% пользователей. Это очень хорошо скажется на оценках, а они нам понадобятся в дальнейшем.

Способ монетизации

Забудьте о платных приложениях! В Android Market это не работает. Можно выложить хорошую игру за 1 доллар и ждать месяц пока ее хоть кто-нибудь скачает. Платный рынок плотно оккупирован студиями и качественными приложениями. Поэтому наш выбор — реклама, в моем случае это был AdMob. Доход от рекламы очень стабильный, в отличие от продаж. И самое главное, он прямо пропорционален количеству пользователей. Вообще, рынок Android переживает сейчас взрывной рост, в день приобретается 850 тыс. аппаратов, и люди хотят наполнить их приложениями. В 99% случаях это будет бесплатное ПО.

Платное отключение рекламы

Дайте возможность людям, которые ненавидят рекламу всей душой, отказаться от нее, заплатив небольшую сумму. Для этого придется интегрировать In-app-purchase. Способ с отдельным платным приложением в моем случае не сработал. Советую тщательно отладить restoreTransactions(), чтобы пользователь не терял деньги при очистке данных или смене устройства. В моем случае покупки отказа от рекламы приносят пока 5% дохода.

Графика, музыка — где всё это брать?

Сразу скажу, что писал игру я в одного. Ни музыкантом, ни художником я не являюсь, поэтому всё было скачано из интернета — картинки Google, бесплатные звуки и т.д. Разве что картинку под игровым полем нарисовал один хороший знакомый – пользуясь случаем, передаю ему привет! Основными рабочими инструментами стали Paint.NET и Wave Editor (обе программы бесплатные и весят по 3 Мб). Кстати, в конце я склонялся к разработке в Windows больше, нежели чем в Ubuntu. Как-то там слегка удобнее всё.

Движок, NDK и фрагментация

Объем исходного кода – около тысячи строк на Java. Повторюсь, алгоритм очень прост. Никаких движков при разработке я не использовал. То же касается и NDK. Благодаря этому, игра запускается на большом количестве устройств – в статистике Flurry я вижу 327 разных типов телефонов и планшетов. И даже на нетбуках с x86 процессором она, оказывается, работает. Таким образом, слухи о фрагментации Android оказались сильно преувеличенными. Не запускается или глючит игра только на совсем уж китайских устройствах. Сбойных сессий – 0.14%, ими можно пренебречь. В первых версиях, ошибок было гораздо больше, только в консоль маркета пришло более ста отчетов. Большинство ошибок было исправлено.
Так как игра относится с разряду board game, я применил обычный GridView с изображениями. Анимация выполнена с помощью Handlerи postDelayed(). OpenGLне использовался.

Продвижение

На рекламу игрушки я не потратил ни копейки. Существует масса эффективных и бесплатных способов продвижения. Начал я с анонса в своей ленте Google+. Читателей у меня не так много, ~2000. Несколько раз помогли друзья с репостами. Также, написал в твиттер, спасибо жене, у нее там довольно много фолловеров. На тот момент, у меня было чуть больше тысячи игроков.
Пожалуй, самым главным толчком стала публикация бесплатного обзора на 4PDA. Ни в коем случае не пренебрегайте этой возможностью! Их проект поддержки российских разработчиков — это просто чудо. Несмотря на минусы, которые обзор получил на главной, он принес такое количество пользователей, что теперь я готов заплатить по 100 руб. каждому минусующему 😉 Рейтинг и количество закачек пошли в гору, и мне кажется, что этот процесс уже не остановить.

Маленькие хитрости

Конечно, я применил все знания, полученные на Хабре, спасибо авторам статей. Например, однократный диалог с просьбой оценить игру на маркете. Мой выглядит вот так:
 
Возможно, знатоки НЛП предложат другой вариант, но и этот хорошо работает. Также, рекомендую сразу встроить Scoreloop и аналитику от Flurry. Или вот такой диалог при достижении рекорда, с возможностью поделиться в соц. сетях:
 
Всё это значительно повышает соревновательность и вовлеченность.

Так как насчет миллиона?

Конечно, миллион вы получите не сразу, а в течение нескольких лет. С другой стороны, рублей или долларов? Вопрос интересный. В начале, суточный доход от рекламы удваивался каждые три дня. Затем, скорость уменьшилась. По моим расчетам, каждая закачка приносит один доллар на рекламе в долгосрочной перспективе. Именно поэтому цена запрета рекламы — 0,99$. Сейчас у меня происходит примерно 6000 закачек в сутки. Посмотрим, что будет дальше!