Um dos maiores problemas com o surgimento da internet foi a facilidade de acesso a conteúdo pirateado. Da música aos videogames, diversas indústrias afetadas pela pirataria criaram contramedidas para proteger seu conteúdo. Como resultado, a indústria musical é extremamente rigorosa na aplicação das leis de direitos autorais. Vídeos do YouTube, ou mesmo contas inteiras, são frequentemente removidos se incluírem músicas protegidas por direitos autorais sem a devida licença do usuário. No entanto, obter licenças de música pelos canais adequados pode ser muito demorado e caro. Para solucionar esse problema, Alexey Kochetkov criou Mubert, um gerador de música com IA.

O que é a Mubert?

O fundador e CEO, Alexey Kochetkov, possui formação em ciência da computação e educação musical. Mubert nasceu da experiência de Kochetkov em ambas as áreas. Com MubertKochetkov espera causar grande impacto na indústria musical e oferecer soluções musicais acessíveis para streamers de videogames, desenvolvedores de assistentes de voz e diversos outros setores.

Além disso, a equipe de pesquisa em Mubert está trabalhando para criar um “DNA musical”, por meio do qual a música pode ser personalizada para indivíduos com base em suas preferências e na atividade durante a qual a música está sendo tocada. Conversamos com Kochetkov para saber mais sobre o produto.

AlexeyMubert é uma empresa de música com inteligência artificial. Estamos desenvolvendo um algoritmo que usa inteligência artificial para gerar música original contínua para uso comercial ou pessoal, que pode ser facilmente personalizada e transmitida em todo o mundo. No nível mais básico do aplicativo, os usuários tocam em um botão para escolher música para uma atividade ou gênero específico. Em seguida, Mubert O aplicativo irá gerar músicas para essa categoria em um andamento e escala aleatórios. Em seguida, os usuários podem ajustar a música clicando no botão "gostei" ou "não gostei". É assim que os usuários treinam a IA para gerar músicas mais próximas de seus gostos.

No momento, não é possível alterar o ritmo automaticamente no aplicativo para celular. No entanto, estamos trabalhando para desenvolver aplicativos que permitam o controle total da música. Nosso primeiro objetivo era criar um aplicativo onde os usuários pudessem tocar música sem parar com o simples toque de um botão.

Por outro lado, a empresa oferece um serviço privado. API Para empresas que necessitam de soluções musicais mais personalizadas. Através do APIOs clientes podem controlar o gerador de música com IA e personalizá-lo. Eles também têm a capacidade de personalizar os dados de entrada e usá-los para criar música.

Como surgiu a ideia para este gerador de música com IA?

AlexeyCerto dia, eu estava correndo com um amigo. Todos os dias, corríamos dez quilômetros. Durante esse tempo, conversamos sobre como era irritante ter que trocar de música nas playlists que estávamos ouvindo. Principalmente quando você só quer se concentrar na atividade, como correr, é muito chato ter que ficar trocando de música.

Comecei a contar para ele sobre uma ideia que eu tinha para um algoritmo que geraria música com base no meu ritmo de corrida. Foi assim que Mubert Assim nasceu o projeto. A ideia era gerar uma playlist infinita e ininterrupta baseada em um ritmo e um estado de espírito específicos. Um aplicativo como esse ajudaria muito as pessoas a se manterem concentradas.

Listas de reprodução com várias músicas e artistas não conseguem manter as pessoas concentradas por muito tempo. Naquele dia, reuni cinco amigos e começamos a desenvolver esse algoritmo. Um ano depois, mudamos a equipe e transformamos o projeto em um negócio lucrativo.

Que lacunas existem no mercado? Mubert Preenchimento: e que problemas isso resolve para os criadores?

AlexeyAtualmente, observa-se uma tendência crescente de regulamentações mais rigorosas para conteúdo protegido por direitos autorais. Empresas enfrentam grandes dificuldades para adicionar música a seus serviços e aplicativos, ou para reproduzir música em espaços públicos. Legalmente, as empresas precisam adquirir os direitos autorais do conteúdo antes de utilizá-lo. No entanto, essa é uma tarefa que consome muito tempo.

A música generativa ou os geradores de música por IA podem resolver esse problema para empresas em todo o mundo. Nossa plataforma permite a transmissão global de música. Detemos todos os direitos sobre nosso conteúdo. Portanto, podemos transmiti-lo globalmente e dar acesso a outras empresas que tenham contrato conosco.

Outro problema é que os músicos não conseguem monetizar suas músicas ou sons com facilidade. Resolvemos esse problema pagando royalties aos músicos para que forneçam samples de sons e músicas. Nossa equipe utiliza esses samples de sons e músicas em MubertNós as transmitimos como faixas completas ou as utilizamos para criar novas músicas para nossos clientes corporativos. Esta música é protegida por direitos autorais e isento de royalties.

Quem você acha? Mubert É mais útil para quê?

AlexeyOs casos de uso mais comuns hoje em dia são os serviços de streaming e os assistentes de voz. Outro grande mercado-alvo é a música para espaços públicos. Esses casos de uso enfrentam problemas semelhantes em relação ao conteúdo protegido por direitos autorais. Para espaços públicos, qualquer música reproduzida deve ser licenciada, sob pena de multa. Um caso notório foi o da Peloton, empresa que transmite música para esportes. Este ano, ela foi multada em 150 milhões de dólares por usar música protegida por direitos autorais.

Mubert é uma plataforma que facilita a obtenção de música para esses casos de uso. Com nossos serviços, você pode reproduzir música livre de direitos autorais, eliminando o risco de multas por usar músicas protegidas por direitos autorais.

Este gerador de música por IA é baseado em um modelo generativo semelhante às GANs?

AlexeyMubert é muito diferente desses algoritmos. É um API e um aplicativo para geração de música, mas não é um algoritmo generativo. A rede neural em si é usada principalmente para classificação de sons, análise de dados e criação do nosso banco de dados. Esse banco de dados é analisado por algoritmos musicais baseados em regras musicais. Finalmente, a plataforma de streaming transmite música para nossos clientes.

Quando a música está sendo gerada, o programa simplesmente junta os sons. Não precisamos usar redes neurais para isso. No entanto, para juntar os sons corretamente, é necessário que os sons que combinam entre si sejam iguais. humor exigem o uso de aprendizado de máquina e algoritmos de big data. Outra coisa em que estamos trabalhando são os botões de curtir e não curtir, que as pessoas podem usar para personalizar as playlists de acordo com seus gostos individuais. Isso essencialmente se torna uma IA pessoal para o usuário, e usamos esses dados para criar uma experiência personalizada para todos que utilizam o serviço. Mubert.

Para compor sons corretamente, precisamos capturar pequenas características de cada som. Temos um grande banco de dados com cerca de 500,000 amostras. Essas amostras precisam ser classificadas com precisão, e precisamos encontrar todas as características de cada som e usá-las para gerar música melhor.

Existe um amplo conjunto de parâmetros que podem ser extraídos de cada som, por exemplo, sons leves, sons encorpados, sons com um andamento de 120 BPM. Esta é a principal área onde os algoritmos de IA trabalham em conjunto. Para resolver diferentes problemas, é necessário usar algoritmos diferentes. Isso depende da tarefa que buscamos resolver em cada etapa do processo.

Você utiliza pessoas para garantir que os dados estejam sendo classificados corretamente?

Um dos maiores problemas na IA hoje é o acesso a dados de treinamento de alta qualidade. Além disso, muitas vezes precisamos de intervenção humana para anotar os dados, adicionar rótulos ou outros metadados antes que possam ser usados ​​para treinamento. MubertNo caso dele, manter um banco de dados com mais de 500,000 amostras de som e música não é tarefa fácil.

AlexeyTemos uma equipe de 2,000 músicos trabalhando conosco neste sistema. Além disso, contamos com alguns diretores que verificam os resultados do algoritmo de IA. Acredito que, no futuro, utilizaremos esses algoritmos para classificar dados tanto sobre os sons quanto sobre o ouvinte.

Acabamos de começar a implementar o recurso de curtir e não curtir. Usando esses dados de nossos clientes, estamos tentando analisar o momento em que alguém "curte" ou "não curte" uma determinada faixa. Precisamos analisar todas as características dos sons que estão sendo reproduzidos naquele instante.

É possível obter lucro com essa música sem pagar direitos autorais adicionais?

AlexeyNo momento, quero construir um negócio sem royalties. Quero criar um modelo de assinatura onde você paga um valor mensal e tem acesso ilimitado a músicas. No entanto, para isso, só podemos usar samples dos quais possuímos todos os direitos. Portanto, precisamos comprar os direitos autorais de todos os samples de áudio ou música.

Compramos pacotes de samples, usamos, transformamos e adaptamos para diferentes gêneros, tempos e escalas. Em seguida, criamos nossos próprios samples com base em sons gerados por músicos e temos os direitos de uso para utilizá-los como quisermos. Por fim, podemos vendê-los para qualquer empresa no mundo todo. É assim que quero construir esse modelo para API soluções.

Как е Mubert Melhor que o Spotify ou qualquer outro aplicativo de streaming de música?

AlexeyMubert Ajuda você a se concentrar melhor. Ao contrário do Spotify ou de outros aplicativos, Mubert Não tem interrupções nem pausas. Nossos fluxos de música estão em um loop contínuo e infinito. O ritmo das músicas é o mesmo. Não há mudanças no clima da música durante toda a faixa. Testamos nossos protótipos com corredores e praticamente todos disseram a mesma coisa:

"Mubert Ajuda você a se concentrar na tarefa específica para a qual a faixa foi criada. É quase como meditar.”

Quais seriam os principais impactos? Mubert Você trabalha na indústria da música ou em outras indústrias?

Com o lançamento da tecnologia de voz sintética e deepfake, muitas pessoas temem que essa tecnologia leve à perda de empregos em diversos setores. Por exemplo, as vozes sintéticas podem representar ameaças para dubladores. Da mesma forma, o GPT-2, lançado recentemente pela OpenAI, é apontado como um risco para o emprego de escritores. Mubert Se outros geradores de música por IA se tornarem populares, provavelmente terão um grande impacto em diversos setores.

Alexei: É claro que haverá alguns impactos das tecnologias de IA. Mas acredito que todo o mercado se fortalecerá com elas e elevará a indústria a um novo patamar. Assim como o surgimento da tecnologia de gravação transformou drasticamente a indústria musical, a IA impulsionará uma nova era para todo o mercado.

Mais importante ainda, as pessoas querem ouvir artistas, não apenas músicas geradas por máquinas. As pessoas usam músicas geradas por máquinas principalmente como música de fundo ou para audiolivros.

Na minha opinião, podemos dividir a música em dois tipos: música de fundo e música de artistas. Música de fundo serve para atividades como corrida ou trabalho. Dito isso, a tecnologia em torno de artistas virtuais tem futuro. Se criarmos um artista virtual com inteligência artificial, acho que seria interessante ver como ele evolui.

Qual é o seu sonho para... MubertO que você gostaria de ver no futuro dos geradores de música por IA?

AlexeyQuero criar um DNA musical, uma tecnologia através da qual seus gostos pessoais possam ser refletidos nas ondas sonoras que você ouve. Pode ser uma música com vocais ou uma música de fundo. No entanto, quero criar algo completamente pessoal, algo tão próximo do seu gosto que você não vai querer tirar os fones de ouvido.

Além disso, gostaria de colaborar com tecnologias de voz sintética. Porque sinto que Mubert E vozes sintéticas poderiam criar um artista sintético! Estamos trabalhando agora para adicionar vocais a Mubertsintetizar vozes e, com sorte, construir artistas virtuais.

O mais importante é que nossa análise não se limita ao som em si; ela se concentra no momento. Não se trata simplesmente de "Estou trabalhando e ouvindo música techno". É muito mais profundo do que isso. Por exemplo: "Estou trabalhando e ouvindo este gênero. Os sons são leves. Esta percussão utiliza os sons de uma bateria analógica". Não estamos apenas adaptando a música ao indivíduo, mas sim ao seu comportamento e ao momento em que ela está sendo tocada.

Quero criar uma nova dimensão no estilo de vida das pessoas, onde elas possam ter música personalizada para cada atividade, para cada momento de suas vidas.