AudioCidades

Manuais e apostilas » Introdução ao áudio digital

Introdução ao áudio digital

Rhatto e Rafael Diniz

Para que nada fique às escuras, partamos do princípio. Esta seção inicial é apenas ilustrativa. Se você achá-la muito complicada, não se preocupe, ela foi escrita apenas para dar uma noção básica de como lidamos com o áudio e sua compreensão não é crucial para fazer uma rádio pela internet.

Referência rápida sobre áudio digital

Som

Afinal, o que é o som? Simplificadamente, o som é uma vibração de um meio material. Por vibração podemos entender como sendo uma onda, que é um ente que transporta uma perturbação de um meio material. No ar, por exemplo, uma perturbação da pressão atmosférica provoca uma onda, devido à elasticidade de suas moléculas chocando-se mutuamente de tal forma que essa perturbação é transportada no espaço. Quando essa perturbação chega ao nosso ouvido ou num microfone, ela causa a vibração das respectivas membranas e ambos convertem essa perturbação da pressão do ar numa equivalente elétrica. Nessa transformação, o meio pelo qual essa onda passou a se propagar bem como sua fenomenologia mudaram, mas a sua essência, que é a informação contida na perturbação – o sinal –, foi preservada.

Representação de um sinal de áudio

Uma maneira de representar esse sinal de informação sonora é por meio de gráficos. Suponha que você está no sofá de sua casa ouvindo alguém tocando sanfona no outro lado da sala. As vibrações do ar chegam até seus ouvidos. Essas oscilações na pressão atmosférica (que nada mais é do que a força que as moléculas de ar aplicam numa área) fazem com que a membrana auditiva de cada um dos seus ouvidos também vibre, e a partir disso um complicado processo de conversão ocorre até que esse sinal chegue bem dentro da sua cabeça de tal forma que você escute o som da sanfona.

Se fizermos um gráfico mostrando como varia no seu ouvido a pressão atmosférica com o tempo, teríamos algo assim:

Esse gráfico significa que, no istante de tempo a, a pressão atmosférica no seu ouvido valia d e no instante b valia c. A linha cheia com o aspecto de onda representa o valor da pressão em cada instante de tempo. De fato, esse desenho parecido com uma onda pode ser entendido como uma onda sonora que chega até seu ouvido. Normalmente, a onda sonora não tem um aspecto tão bonitinho e tem o aspecto mais bagunçado, assim:

Sinais analógicos e digitais

Chegou a hora de introduzirmos os conceitos mais importantes da seção. Os gráficos que você viu até agora mostram que a cada instante de tempo havia associada alguma grandeza física (no caso, a pressão atmosférica) associada ao som. Quando o microfone converte essa grandeza física para a tensão elétrica, essa associação é mantida. Os sinais de informação que apresentam essa característica de analogia entre cada instante de tempo e o respectivo valor são chamados de sinais analógicos ou contínuos, pois para todo instante de tempo há um valor da pressão atmosférica no seu ouvido ou um valor de tensão elétrica entre os fios de um microfone.

Os sinais que não apresentam essa característica são chamados de sinais digitais. Esses serão discutidos no próximo tópico.

A Placa de Som

Nada melhor do que um exemplo para ilustrar o que é um sinal digital e como um sinal analógico é convertido em sinal digital (e vice-versa). O equipamento que mais estamos acostumados a lidar para esse tipo de tarefa é a placa de som presente na maioria dos computadores. Uma placa de som nada mais é do que um conversor Analógico/Digital e Digital/Analógico otimizada para sinais sonoros.

Nos outros tutoriais você verá como ligar um microfone ou outro dispositivo de áudio na sua placa de som. Por hora é suficiente sabermos que um placa de som é um equipamento que funciona conforme o seguinte desenho:

O sinal analógico entra na placa e sai convertido num sinal digital, e os sinais digitais que entram na placa saem dela convertidos em sinais analógicos. A conversão de um sinal analógico é feita da seguinte maneira: o sinal que chega até a placa é amostrado em intervalos de tempo fixos (por exemplo, de 1 em 1 segundo) e o valor de tensão elétrica (voltagem) do sinal analógico naquele instante é armazenado em números binários. Aqui aparecem as duas grandes diferenças entre um sinal analógico e um digital: no caso analógico, para todos os instantes de tempo existem associados valores de tensão elétrica, ou seja, o sinal é contínuo. Além disso, esses valores de tensão elétrica (isto é, as informações) são grandezas físicas. Já um sinal digital possui informações apenas para alguns instantes de tempo, ou seja, o sinal é discreto. E mais, o sinal digital existe num formato que independe das grandezas físicas que o contém, já que as informações são representadas utilizando números inteiros e finitos (os dígitos) e não a tensão elétrica ou a pressão atmosférica, por exemplo. Nos sistemas digitais atuais, esses números são manipulados utilizando a base numérica binária (0 e 1), mas essa é outra história...

A discussão anterior pode ter ficado um pouco árida, então aqui segue um desenho para ilustrar as diferenças entre um sinal analógico e outro digital:

Analógico versus Digital

Nesse ponto precisamos de uma pequena reflexão sobre o aparente antagonismo entre os sinais analógicos e digitais e a atual valorização deste último em detrimento do primeiro. Você já deve estar acostumado ou acostumada a ouvir sobre as "maravilhas do áudio digital" ou de que tudo que é digital é superior. Mas será isso verdade? Por que ocorre essa fixação pelo digital?

Não sabemos ao certo o motivo. Historicamente, os sinais digitais ganharam hegemonia pois possuem um controle de erro mais simples para transmissão e recepção de mensagens e as perdas de sinal são praticamente nulas. Mas é interessante notar que, quando um sinal analógico é digitalizado, ocorrem perdas de informação inerentes a esse processo. Esse debate vai longe, principalmente no que diz respeito ao retorno dos computadores analógicos, então deixaremos este tópico para uma outra oportunidade.

Propriedades de um sinal de áudio digital

Para o estudo das transmissões de áudio pela rede, basta que saibamos três propriedades de um sinal digital: seu número de canais, sua taxa e razão de amostragem.

Como você viu nos desenhos, um sinal analógico é digitalizado selecionando apenas alguns trechos do sinal analógico e transformando essa informação em números inteiros. O número de vezes por segundo em que uma amostra do sinal analógico é colhida é chamado de taxa de amostragem (sample rate) e a quantidade de valores numéricos que essa informação pode assumir é chamada de razão de amostragem (bits per sample). Valores usuais para a taxa de amostragem são de 11,025KHz (11025 amostras por segundo), 22,05KHz ou 44.1KHz e a razão de amostragem costuma ser de 8 bits, 16 bits ou 32 bits, lembrando que 1 bit é a menor unidade de informação, que pode assumir apenas dois valores diferentes, 0 ou 1 (verdadeiro ou falso). Um número de 8 bits pode assumir até 256 valores diferentes, ou seja, pode representar até 256 valores de tensão elétrica (o sinal analógico) diferentes. Já um número de 16 bits pode representar até cerca de 65 mil valores diferentes, e assim por diante.

Quanto maiores forem a taxa e a razão de amostragem, mais alta será a qualidade do sinal digitalizado com relação ao sinal analógico original.

Por exemplo, para um sinal digital com taxa de amostragem de 11,025KHz e razão de amostragem de 8 bits possui um 11025 valores de 8 bits por segundo. Já com uma taxa de amostragem de 44100KHz e razão de 16 bits temos, a cada segundo, 44100 amostras podendo cada uma representar 65 mil níveis diferentes de perturbação sonora, o que é mais do que suficiente para pessoas comuns não perceberem que estão escutando um sinal não-contínuo.

Quando você grava um áudio no seu computador, o programa de gravação normalmente armazena todas essas informações num arquivo cujo nome termina com um .wav, por exemplo audio.wav. Esse tipo de arquivo é chamado de Wave File (arquivo de onda), em alusão à ondas sonoras.

Áudio comprimido: MP3 e OGG

Chegou a hora de darmos o pulo do gato. O áudio digitalizado ocupa muita informação. Da discussão precedente, um áudio com milhares de amostras por segundo tendo cada amostra um tamanho de 8 a 32 bits supera em muito a capacidade de armazenamento dos computadores atuais. Armazenar arquivos do tipo wav gasta tanto espaço que você não conseguiria ter muitas horas de música em seu computador. Transmitir essas músicas pela internet, então, nem pensar. Com a velocidade atual das conexões é inviável transmitir tais arquivos.

A solução tecnológica para driblar esse obstáculo foi o advento da compressão dos arquivos de áudio. Da mesma forma que você pode compactar um arquivo num outro de tamanho menor (texto ou imagem), também é possível comprimir arquivos de áudio para tamanhos menores. Isso é feito eliminando do áudio frequências inaudíveis ou pouco audíveis por seres humanos e utilizando métodos de compactação de dados. Um arquivo de áudio comprimido, dependendo de suas características, pode ser mais de dez vezes menor do que o arquivo wav original. É esse tamanho reduzido que possibilita as rádios via internet, que nada mais são do que transferências de arquivos de áudio comprimido, ao vivo ou não.

Os dois formatos de arquivos de áudio comprimidos mais conhecidos são o MP3 e o OGG. O MP3 não é um formato em Copyleft (livre) e já é um pouco antigo, enquanto que o OGG é livre e de maior performance.

Para fazer um arquivo em MP3 ou OGG, é necessário comprimir o áudio original. Para ouvi-lo, é preciso descompactá-lo, e isso é feito através de programas de reprodução de áudio.

Assim como para o áudio digital do tipo wav tem suas propriedades de amostragem, o áudio comprimido tem sua razão de amostragem (bitrate) em kbps (mil bits por segundo) e quando descompactado também apresenta uma taxa de amostragem de 11,025KHz, 22,05KHz ou 44.1KHz e valores de bits por amostra (bits per sample) de 8 ou 16.

Um áudio comprimido de boa qualidade tem 192kbps de bitrate, sample rate de 44,1KHz e 16 bits per sample. Para transmitir um arquivo desse tipo em "tempo real" pela internet atual ainda é um pouco complicado, então os valores ideais para uma rádio via internet são bitrate de 16 ou 24kbps, sample rate de 11,025KHz ou 22,05KHz e 16 bits per sample.

Metadados

Os arquivos compacatados em MP3 e OGG ainda possuem uma grande facilidade, conhecidas como metadados (ou etiquetas): são ditos metadados por serem informações sobre o áudio como nome da música, nome do artista, álbum, número da faixa, data da gravação. Isso é muito útil por possibilitar que esse tipo de informação não fique restrita apenas ao nome do arquivo. Você pode ter um arquivo de mp3 como o nome birosca.mp3 e mesmo assim ainda armazenar todas essas informações, já que os metadados são guardados dentro do arquivo de áudio e não em seu nome de arquivo. A diante veremos que os metadados são utilizados na transmissão de áudio pela internet para enviar o nome da música aos ouvintes.

Agora que você já está com uma boa base sobre áudio digital, vamos focar no funcionamento das transmissões desse tipo de áudio pela rede.

Tipos de transmissão

Transmissão assíncrona

A primeira é a mais simples e é a melhor opção para quem não tem condições de fazer uma rádio ao vivo, mas sim utilizando arquivos de áudio (mp3 ou outro formato pré-gravado e armazenado no seu site). Esse método é conhecido como transmissão assíncrona ou sob demanda.

Na transmissão assíncrona, os áudios são gravados num computador qualquer e em seguida são enviados a um servidor de internet, junto com uma lista contendo o nome desses arquivos. Quem quiser escutar algum desses programas simplesmente utiliza um programa de áudio para solicitar esses arquivos diretamente do servidor.

Esse procedimento é explicado em detalhes em Como montar uma webrádio.

Transmisssão síncrona ou "ao vivo"

A segunda opção para webrádio é um pouco mais complicada e é usada para veicular uma rádio ao vivo pela internet. Pra começar, é preciso de um computador com acesso à internet e uma placa de som.

Note que "ao vivo" não quer dizer no mesmo instante. É inviável ter uma transmissão/recepção instantânea. Primeiro porque, no universo observável, a velocidade máxima da informação é a velocidade da luz. No caso da transmissão via ondas eletromagnéticas (rádio AM, FM, etc) esse limite é quase atingido, mas no caso da internet existem vários fatores que fazem com que hajam até três minutos de diferença entre a mensagem ser enviada e recebida.

Etapas de uma transmissão síncrona

Numa transmissão síncrona, é possível tanto transmitir músicas armazenadas no computador (nos formatos mp3, ogg, etc) quanto veicular áudio externo, que é inserido na transmissão através da placa de som do computador. Nisto constitui a primeira etapa de uma transmissão síncrona: selecionar as fontes de áudio.

Na segunda etapa, o áudio das fontes é comprimido e codificado nos formatos mp3 ou ogg. Em seguida, esse áudio em ogg ou mp3 é enviado ao servidor de webrádio.

Do outro lado da transmissão está o computador do ouvinte, que através de um programa reprodutor de áudio se conecta ao servidor de webrádio, recebe o áudio e faz com que este seja reproduzido no auto-falante do seu computador.

Resumindo, podemos dizer que uma transmissão síncrona é equivalente a produzir e enviar pela internet um arquivo de mp3 (ou similar) em tempo real. A cada etapa do processo há um pequeno atraso devido ao processamento dos computadores, à velocidade da conexão, etc, que podem fazer com que o intervalo entre a transmissão e a recepção da informação seja de até três minutos. As seções seguintes tratam de forma um pouco mais detalhada cada etapa da transmissão síncrona.

Como funciona uma transmissão?

Para esclarecer como uma transmissão ao vivo funciona, dividiremos esse assunto em duas partes. Primeiro daremos uma visão geral da relação entre as transmissões, os servidores e os ouvintes (a chamada topologia dessa rede) e em seguida veremos os protocolos utilizados.

Topologia

A transmissão de áudio pela internet, ou streaming (correnteza), funciona por meio de um programa fonte, que envia o áudio para os servidores, que por sua vez enviam a transmissão para os clientes, que são os programas de reprodução de áudio.

Um esquema genérico é reproduzido no diagrama abaixo:

O programa fonte utiliza como fonte de áudio o sinal presente na entrada placa de som e os arquivos de áudio presentes no computador fonte. A mistura desses sinais – a mixagem do sinal da placa de som com os arquivos de áudio – é então comprimida e codificada no padrão mpeg (o padrão mp3) ou ogg. O sinal comprimido é então enviado para os servidores até o servidor de streaming. Um programa fonte pode mandar esse sinal para vários servidores diferentes.

Caso o áudio que se quer transmitir vai ser captado pela entrada da placa de som, ele precisará ser codificado para um formato digital com taxas de amostragem e qualidade definidas e caso o áudio venha de um arquivo digital já presente em disco ou de um outro stream, este terá de ser codificado/convertido para as taxas de amostragem e qualidade definidas, logo, utilizaremos neste Manual a nomenclatura "encoder" para se referir ao software que irá prover o áudio para o servidor. No caso do áudio digital que você estiver transmitindo tiver taxa de amostragem e qualidades diferentes dos da sua transmissão, o encoder fará a conversão desses atributos para que o áudio possa ser transmitido.

Voltando ao diagrama, vemos que um servidor de streaming pode receber várias transmissões provenientes de diferentes fontes ao mesmo tempo.

No outro lado, vemos que um servidor pode enviar transmissões simultaneamente para mais de um cliente. Repare que o cliente 1 pode escolher receber a transmissão do computador 1, do computador 2 ou de qualquer outro que esteja transmitindo. O mesmo acontece para o cliente 2 e para todos os outros clientes que estiverem conectados no servidor.

Existe caso especial do diagrama acima, quando o computador fonte também é o servidor. Esse tipo de configuração não é recomendável.

Primeiro, porque cada cliente consome um pouco da conexão do servidor à internet. Normalmente os locais de onde se vai fazer a transmissão não tem acesso à internet rápida o suficiente para distribuir o sinal para muitos clientes. Um servidor com uma conexão de 128kbps, por exemplo, suporta enviar um áudio de 24kbps para no máximo 5 clientes, um número muito baixo.

Mesmo se a sua conexão for muito rápida, ainda assim não é recomendável utilizar um computador simultaneamente como fonte e servidor. Um programa fonte consome muito processamento do computador, às vezes o suficiente para inviabilizar o envio do sinal para muitos clientes. Por outro lado, um computador que apenas é servidor de áudio quase não gasta em termos de processamento, pois tudo que ele tem de fazer é reenviar aos clientes o sinal recebido pelas fontes.

Por esses motivos existem servidores dedicados, com banda suficiente para abrigar muitas fontes e muitos clientes. Resumindo, esse tipo de configuração equilibra os recursos da rede de webrádios, deixando o processamento computacional no lado das fontes e a capacidade de transmissão do lado dos servidores.

Cabe aqui a observação de que existem inúmeras outras formas de se fazer uma rede de webrádio, mas essa configuração é a mais viável onde existem poucos servidores com conexão muito rápida.

Algo que é possível de se fazer é utilizar um esquema cliente e servidor num computador com pouca conexão transmitindo para vários servidores também com conexão não muito rápida com a internet. Estes então transmitem o áudio para os ouvintes, possibilitando que se faça transmissões pela internet sem precisar de conexão extremamente rápida.

Protocolo

A seguir temos uma rápida discussão sobre os protocolos de comunicação usados na internet que pode parecer um pouco sem sentido no contexto de um guia rápido sobre transmissão de áudio. No entanto ela contém informações de base para o entendimento da própria rede de computadores. A leitura desta seção é recomendada, mas se você estiver com preguiça pode pulá-la tranquilamente ou então só deixar de ler os próximos dois parágrafos.

Protocolos são os métodos pelos quais convencionamos fazer as coisas. No tocante à computação, os protocolos referem-se a como programas ou computadores conversam entre si. A internet fundamenta-se na fusão de protocolos conhecida como TCP/IP (Transfer Control Protocol/Internet Protocol). O protocolo resultante é utilizado em redes onde vários computadores conversam entre si ao mesmo tempo. Resumidamente, cada computador possui um número único, o número IP. As informações intercambiadas entre os computadores são divididas em pacotes e cada pacote é "jogado" na rede. Cada computador que recebe verifica se o pacote foi endereçado para si e caso negativo ele passa o pacote para frente, até que este chegue ao seu destinatário. Existe ainda um avançado esquema de controle, checagem de erro e verificação de recebimento de pacotes. Ou seja, o TCP/IP é apenas um protocolo que cuida para que a informação seja transmitida de um computador para outro até chegar a seu destinatário e informar ao computador emissor se a mensagem chegou ou se houve algum erro. Chamemos esse tipo de protocolo de protocolo de transporte, pois ele só trata da transferência de dados de um computador para outro.

Para que os computadores possam conversar ainda é preciso definir outro protocolo, um "idioma" que seja transmitido via pacotes TCP/IP, que é apenas um protocolo de transporte. Existem vários protocolos deste tipo, como o FTP (File Transfer Protocol ou Protocolo de Transferência de Arquivos), o HTTP (que veremos adiante, o HTTPS (HTTP Seguro) e muitos outros mais. Chamemos estes de protocolos de conversa ou idioma. O TCP/IP permite que um mesmo computador converse ao mesmo tempo com vários outros computadores em vários desses idiomas ao mesmo tempo. Isso é possível graças aos números conhecidos como portas. Funciona da seguinte maneira: para cada protocolo de conversa o TCP/IP reserva uma porta, que nada mais é do que um número. Quando um programa de computador de uma máquina deseja conversar com outra em HTTP, esse programa coloca no pacote TCP/IP o número da porta específica a esse protocolo (que por convenção é o número 80 para o HTTP). A seguir esse pacote de informação "cai" na rede e quando chega ao seu destino ele é enviado ao programa responsável pelo programa que conversa naquele idioma de acordo com o número da porta, que nesse exemplo é a 80 para o HTTP. A relação entre o número da porta e o respectivo protocolo (ou serviço oferecido) tem uma padronização que é muito útil para a intercomunicação entre computadores. Por exemplo, se um programa de FTP quiser conversar com outro computador, ele tentará logo de cara a porta 21. Se for HTTP, ele tentará 80. Isso não limita, por exemplo, utilizarmos HTTP em outras portas, como veremos adiante.

O que discutimos até aqui é o funcionamento básico da internet. Numa transmissão de áudio, o sinal é transmitido pela internet através do protocolo HTTP (Hypertext Transfer Protocolo), o mesmo protocolo usado pelos navegadores para transferir arquivos na Web. Como o próprio nome diz, inicialmente esse protocolo foi criado para a transferência de arquivos de Hipertexto do tipo HTML da forma como você o utiliza quando navega em sites, mas dada a sua simplicidade e eficiência ele seu uso foi estendido para a transferência de qualquer tipo de arquivos e inclusive áudio e vídeo. Na Internet, protocolo HTTP é totalmente dependente do TCP/IP, pois a conversa entre os computadores no "idioma" HTTP é transmitida através de pacotes TCP/IP.

Aqui é suficiente para nós sabermos que no HTTP só existem duas conversas (também chamadas de métodos) possíveis entre dois programas ou dois computadores: o método de receber informações (método GET) e o método de enviar, ou POST.

Já o método POST é utilizado quando você preenche um formulário em algum site. Desta vez, é você que envia informações e o programa do site apenas recebe.

Para o caso de um áudio pela internet, o protocolo pode ser tranquilamente usado: o computador que faz a transmissão utiliza continuamente um método POST e os computadores dos ouvintes continuamente utilizam o método GET para receber a transmissão diretamente do servidor. O HTTP normalmente é usado na porta 80 para a navegação em sites e na faixa de portas que vai de 8000 a 8100 para a transmissão de áudio.

Resumindo o que foi dito até aqui, os computadores comunicam-se por protocolos de conversa que trafegam de um lugar para outro utilizando um protocolo de transporte, ou seja, um protocolo é encapsulado dentro do outro. Na prática, se você quiser acessar um computador na internet, você precisa dizer ao seu computador qual é o número IP do computador alvo e qual protocolo utilizar. Mas existem milhões de computadores na internet, e consequentemente milhões de números IP, então como saberei o número do computador que quero acessar?

A resposta é que você não precisa ficar sabendo qual é o número do computador que você quer acessar. Normalmente quando você navega pela internet, você contacta outros computadores utilizando nomes, como www.midiaindependente.org. Ao fazer isso, seu computador consulta um servidor de nomes. Um servidor de nomes é um computador especial que contém uma tabela de nomes de computadores e respectivos números IP. Seu computador pergunta qual é o número IP do computador que possui determinado nome e o servidor de nomes consulta seu banco de dados, enviando de volta a você o IP desejado. Em seguida, seu computador pode efetuar a conexão com seu destino utilizando apenas o IP e o protocolo, de acordo com o que foi explicado nos parágrafos anteriores. Isso tudo é feito de forma transparente ao usuário. Existem vários servidores de nome espalhados pelo mundo. Normalmente você utiliza o servidor de nomes que está mais próximo do seu computador.

Resta-nos uma observação sobre o esquema de endereços utilizado na Internet, também conhecido com URL (Uniform Resource Locator ou Localizador Uniforme de Recursos). Quando você quer acessar um site, você costuma digitar algo do tipo http://www.qualquercoisa.seilaoque.org. Esse http avisa o seu navegador para se conectar ao www.qualquercoisa.seilaoque.org usando o protocolo HTTP. Quando isso acontece, o navegador conversa com o programa do site www.qualquercoisa.seilaoque.org e pede para receber o arquivo index.html. Enquanto o navegador recebe esse arquivo ele vai desenhando-o na tela. Se existe um link para o http://www.qualquercoisa.seilaoque.org/links.html, o navegador pede ao programa do site para receber o arquivo link.html. E assim você navega pela internet! É bom lembrar que os caracteres :// podem ser entendidos como os separadores do endereço. O que vem antes desses caracteres é o protocolo e o que vem depois é o endereço. Existe ainda a possibilidade de especificar a porta que será usada pela conexão. Veja o esquema completo:

    .--------------------------------> protocolo
   /         .-----------------------> endereço do site
  |        /           .-------------> porta 
  |       |           /       .------> nome de arquivo ou diretório
  |       |           |      /
prot://nome-do-site:porta/nome

Exemplos de URLs (endereços) são:

O que foi passado nessa seção já é suficiente para compreender o princípio de como não só as transmissões de áudio mas todas as transmissões de dados pela Internet são feitas.

Buffer

As transmissões de áudio em tempo real tem a séria desvantagem de serem suscetíveis ao congestionamento da rede, já que o ouvinte precisa receber dados da transmissão o tempo todo. Para contornar esse problema, os softwares de transmissão e recepção adotaram um sistema de buffer, um armazentamento que funciona como uma memória contra congestionamento da rede, onde o tocador de áudio recebe alguns segundos da transmissão antes de começar a tocar. Dessa forma ele sempre terá armazenado alguns segundos e caso a transmissão interrompa temporariamente a música não precisa parar.

Listagem de diretório

Uma vez que uma transmissão de webrádio começa, as informações sobre ela podem ser enviadas para um serviço de Páginas Amarelas (Yellow Pages), sites que funcionam como uma listagem de diretório que exibem informações sobre cada rádio e ainda um link para escutá-las, possibilitando que sua transmissão seja automaticamente divulgada num local específico.

Exemplos de páginas amarelas são os mantidos pelos projetos Icecast, Oddsock e SHOUTcast. Para que um streaming seja listado nas páginas amarelas, é preciso que o servidor esteja configurado para isso.

Envio dos metadados

Além dos metadados dos arquivos de áudio que são tocados, uma transmissão pode ainda ter seus próprios metadados, como nome da rádio, estilo, qualidade, quantos ouvintes estão recebendo a transmissão, etc. Estes dados são exibidos nas páginas amarelas e alguns deles também são recebidos por quem está escutando a rádio.

Resumindo...

Agora vamos resumir, numa linguagem mais técnica, o que vimos até agora: quando falamos em "Streaming de áudio" estamos nos referindo a uma transmissão de áudio utilizando uma rede TCP/IP através do protocolo HTTP. Na técnica de streaming abordada aqui são utilizadas três instâncias de software para termos o streaming realizado: um programa cliente que irá prover o áudio a ser transmitido, o servidor que irá servir o(s) stream(s) e um player para poder reproduzir o stream.

Agora, tendo uma base de áudio digital, de internet e do esquema cliente/servidor de rádios pela internet, podemos seguir para a parte prática!

Este texto foi extraído do manual Transmissão de Áudio pela Internet e Web Rádios, de Rhatto com colaboração de Rafael Diniz, e adaptado para este CD.