About: WaveNet     Goto   Sponge   NotDistinct   Permalink

An Entity of Type : owl:Thing, within Data Space : dbpedia.org associated with source document(s)
QRcode icon
http://dbpedia.org/describe/?url=http%3A%2F%2Fdbpedia.org%2Fresource%2FWaveNet

WaveNet is a deep neural network for generating raw audio. It was created by researchers at London-based AI firm DeepMind. The technique, outlined in a paper in September 2016, is able to generate relatively realistic-sounding human-like voices by directly modelling waveforms using a neural network method trained with recordings of real speech. Tests with US English and Mandarin reportedly showed that the system outperforms Google's best existing text-to-speech (TTS) systems, although as of 2016 its text-to-speech synthesis still was less convincing than actual human speech. WaveNet's ability to generate raw waveforms means that it can model any kind of audio, including music.

AttributesValues
rdfs:label
  • WaveNet (es)
  • WaveNet (en)
  • WaveNet (sv)
  • WaveNet (zh)
rdfs:comment
  • WaveNet is a deep neural network for generating raw audio. It was created by researchers at London-based AI firm DeepMind. The technique, outlined in a paper in September 2016, is able to generate relatively realistic-sounding human-like voices by directly modelling waveforms using a neural network method trained with recordings of real speech. Tests with US English and Mandarin reportedly showed that the system outperforms Google's best existing text-to-speech (TTS) systems, although as of 2016 its text-to-speech synthesis still was less convincing than actual human speech. WaveNet's ability to generate raw waveforms means that it can model any kind of audio, including music. (en)
  • WaveNet(波網)是一個用於直接生成聲音訊號的人工神經網路。由倫敦人工智慧公司DeepMind的研究人員於2016年9月的一篇論文中提出。 WaveNet通過使用用真實語音記錄訓練的神經網絡方法直接模擬波形,能夠生成聽起來相對真實的人類聲音。除了語音合成外,WaveNet也能應用在音樂生成以及語音辨識等領域。 2018年,Google在其雲端語音合成服務Google Cloud Text-to-Speech中提供了基於WaveNet的語音合成API。截至2019年,該產品提供了32種語言以及多種不同音色的語音合成服務,且基於WaveNet的合成結果在自然度上相比傳統方法更接近人類語音。 (zh)
  • WaveNet es una red neuronal profunda para generar audio muestra a muestra. Está creada por investigadores de la empresa de inteligencia artificial de Londres DeepMind. La técnica, descrita en un artículo en septiembre de 2016, es capaz de generar sonidos realistas como voces humanas modelando formas de onda directamente mediante redes neuronales entrenadas directamente a partir de muestras del habla humana real.​ Pruebas realizadas con inglés y mandarín, mostraron que el sistema superaba los sistemas de síntesis del habla (text-to-speech, TTS) de Google, aunque aún es menos convincente que el discurso humano real.​ La capacidad de Wavenet para generar formas de onda permite modelar cualquier clase de audio, incluyendo música.​ Una empresa emergente canadiense llamada Lyrebird-AI ofrece tec (es)
  • WaveNet är en AI-modell för ljud- och talgenerering som utvecklades av DeepMind, ett företag som ägs av Alphabet. Modellen är känd för sin förmåga att generera realistiskt ljud och tal, inklusive olika röster och språk, med hjälp av en neural nätverksarkitektur. WaveNet tränas på stora mängder ljud- och taldata, och använder sig av den här kunskapen för att generera nya ljud och talsekvenser som inte har existerat tidigare. (sv)
foaf:depiction
  • http://commons.wikimedia.org/wiki/Special:FilePath/WaveNet_animation.gif
dcterms:subject
Wikipage page ID
Wikipage revision ID
Link from a Wikipage to another Wikipage
Link from a Wikipage to an external page
sameAs
dbp:wikiPageUsesTemplate
thumbnail
has abstract
  • WaveNet es una red neuronal profunda para generar audio muestra a muestra. Está creada por investigadores de la empresa de inteligencia artificial de Londres DeepMind. La técnica, descrita en un artículo en septiembre de 2016, es capaz de generar sonidos realistas como voces humanas modelando formas de onda directamente mediante redes neuronales entrenadas directamente a partir de muestras del habla humana real.​ Pruebas realizadas con inglés y mandarín, mostraron que el sistema superaba los sistemas de síntesis del habla (text-to-speech, TTS) de Google, aunque aún es menos convincente que el discurso humano real.​ La capacidad de Wavenet para generar formas de onda permite modelar cualquier clase de audio, incluyendo música.​ Una empresa emergente canadiense llamada Lyrebird-AI ofrece tecnología similar, basada en un modelo de aprendizaje profundo diferente.​ (es)
  • WaveNet is a deep neural network for generating raw audio. It was created by researchers at London-based AI firm DeepMind. The technique, outlined in a paper in September 2016, is able to generate relatively realistic-sounding human-like voices by directly modelling waveforms using a neural network method trained with recordings of real speech. Tests with US English and Mandarin reportedly showed that the system outperforms Google's best existing text-to-speech (TTS) systems, although as of 2016 its text-to-speech synthesis still was less convincing than actual human speech. WaveNet's ability to generate raw waveforms means that it can model any kind of audio, including music. (en)
  • WaveNet är en AI-modell för ljud- och talgenerering som utvecklades av DeepMind, ett företag som ägs av Alphabet. Modellen är känd för sin förmåga att generera realistiskt ljud och tal, inklusive olika röster och språk, med hjälp av en neural nätverksarkitektur. WaveNet tränas på stora mängder ljud- och taldata, och använder sig av den här kunskapen för att generera nya ljud och talsekvenser som inte har existerat tidigare. WaveNet har använts i olika sammanhang, till exempel för att skapa röstfunktioner i Google Assistent och förbättra kvaliteten på röstöversättningar. Modellen har även väckt uppmärksamhet för sin förmåga att generera realistiskt ljud och tal, och har använts för att skapa nya röster och ljudeffekter i musikproduktion. WaveNet är en del av DeepMinds forskningssatsning kring AI, där man utforskar möjligheterna med tekniken och hur den kan användas på olika områden. Målet med forskningen är att bidra till att utveckla AI på ett ansvarsfullt sätt och att hitta sätt att använda tekniken för att lösa viktiga problem och förbättra människors liv. (sv)
  • WaveNet(波網)是一個用於直接生成聲音訊號的人工神經網路。由倫敦人工智慧公司DeepMind的研究人員於2016年9月的一篇論文中提出。 WaveNet通過使用用真實語音記錄訓練的神經網絡方法直接模擬波形,能夠生成聽起來相對真實的人類聲音。除了語音合成外,WaveNet也能應用在音樂生成以及語音辨識等領域。 2018年,Google在其雲端語音合成服務Google Cloud Text-to-Speech中提供了基於WaveNet的語音合成API。截至2019年,該產品提供了32種語言以及多種不同音色的語音合成服務,且基於WaveNet的合成結果在自然度上相比傳統方法更接近人類語音。 (zh)
prov:wasDerivedFrom
page length (characters) of wiki page
foaf:isPrimaryTopicOf
is Link from a Wikipage to another Wikipage of
is Wikipage redirect of
is foaf:primaryTopic of
Faceted Search & Find service v1.17_git139 as of Feb 29 2024


Alternative Linked Data Documents: ODE     Content Formats:   [cxml] [csv]     RDF   [text] [turtle] [ld+json] [rdf+json] [rdf+xml]     ODATA   [atom+xml] [odata+json]     Microdata   [microdata+json] [html]    About   
This material is Open Knowledge   W3C Semantic Web Technology [RDF Data] Valid XHTML + RDFa
OpenLink Virtuoso version 08.03.3330 as of Mar 19 2024, on Linux (x86_64-generic-linux-glibc212), Single-Server Edition (378 GB total memory, 54 GB memory in use)
Data on this page belongs to its respective rights holders.
Virtuoso Faceted Browser Copyright © 2009-2024 OpenLink Software