TubeLens

White paper · Metodologia editorial

Como o TubeLens avalia vídeos

Existem dezenas de métricas pra ranquear vídeos do YouTube — quase todas premiam popularidade. O TubeLens não usa nenhuma delas. Cada vídeo recebe três classificações independentes (sistema TLR): o Lupômetro (qualidade editorial em 4 estados), a Faixa Sugerida (5 níveis de adequação etária derivados de 12 sinais), e o Selo Editorial (3 selos sobre disclosure, fontes e separação opinião/fato). Esta página detalha o que a IA observa, como pondera e por que chega ao veredicto. Nenhum sinal de engajamento (views, likes, inscritos) entra. Tudo público, auditável, sem caixa-preta.

Última atualização desta metodologia: maio de 2026.

O que NÃO entra na nota

Pra ser uma alternativa real ao algoritmo do YouTube, decidimos o que deliberadamente fica de fora do score.

Sinais de engajamento excluídos

  • Views — popularidade não é qualidade.
  • Likes e dislikes — métricas viciadas (bots, brigading; dislike público removido pelo YouTube em 2021).
  • Número de inscritos — autoridade do canal não implica qualidade do vídeo individual.
  • Comentários — engajamento, não conteúdo.
  • Thumbnail e título — podem enganar; importa o que o vídeo entrega.
  • Watch time — métrica do algoritmo, otimizada para retenção, não para qualidade.

Por que excluir tudo isso?

Essas métricas premiam o que viraliza. A tese do TubeLens é exatamente que viralizar não é o mesmo que ser bom — sensacionalismo, clickbait e rage bait pontuam alto em todas elas. Conteúdo educativo profundo de canal pequeno pontua baixo. Se incorporássemos qualquer uma na nota, viraríamos um espelho do algoritmo — perderíamos a razão de existir.

Lei de Goodhart: quando uma métrica vira alvo, deixa de ser uma boa métrica. Se likes virassem parte do score, criadores otimizariam likes — o que o YouTube já incentiva. Não acrescentaria nada.

O que o TubeLens analisa, então?

Apenas o conteúdo — a transcrição do que foi dito, lida com leitura crítica nas 4 dimensões descritas na seção 2. Nada mais.

1. Pipeline da análise

Toda análise passa por 4 estágios determinísticos. Mesmo vídeo entrando hoje e daqui a um mês produz a mesma estrutura de saída — só pode mudar se atualizarmos publicamente esta página.

  1. 1

    Extração da transcrição

    A URL é normalizada e o vídeo é resolvido pelo seu ID de 11 caracteres. A transcrição é obtida via infraestrutura própria que extrai legendas de qualquer vídeo do YouTube com CC habilitado. Quando há legendas em mais de um idioma, priorizamos pt → en → es para máxima qualidade. Não usamos áudio nem reconhecimento de fala — somente o texto que o canal já deixou disponível como CC.

  2. 2

    Engenharia de prompt e contrato de saída

    A transcrição é enviada ao modelo dentro de um prompt rígido que define os critérios, os 28 labels possíveis, as âncoras de score (0/5/10) e a obrigação de citar evidência da transcrição em cada label atribuído. A saída é restringida por um schema estruturado que rejeita qualquer formato inválido — sem prosa livre, sem campos faltando.

  3. 3

    Análise pelo modelo

    Um modelo de IA generativa de última geração processa a transcrição com saída controlada: temperatura baixa para reduzir variabilidade entre execuções e schema rígido para garantir estrutura uniforme. O modelo recebe título, canal, idioma da transcrição e o texto integral, com truncamento em 30.000 caracteres quando necessário (preserva o começo da entrega).

  4. 4

    Pós-processamento e armazenamento

    O score composto é calculado em código (não confiamos no modelo para somar números), o selo é atribuído por faixa fixa, e tudo é gravado em uma única transação no banco de dados. Análises ficam em cache global por video_id — vídeos analisados antes não consomem tokens novamente.

2. Os 4 critérios de avaliação

Cada vídeo recebe nota de 0 a 10 em quatro dimensões. As âncoras são fixas e públicas: 0 = ausente, 5 = média do YouTube, 10 = excepcional. Os pesos definem como elas se combinam no score final.

Densidade informativa

Peso 30%

Quanto conteúdo útil há por minuto. Penaliza repetição, recapitulação excessiva, monólogo introdutório longo, encerramento estendido e qualquer recurso para inflar watch time. Um vídeo de 30 minutos que cabia em 8 será penalizado mesmo se o conteúdo essencial for bom.

Âncoras

0Quase sem informação útil; predomina filler

5Algum filler, dá pra acompanhar em 1.25x

10Cada minuto traz informação nova; recapitulações curtas

Clareza

Peso 30%

Estrutura, didática, organização das ideias. Avalia se há um fio condutor, exemplos quando necessário, definição dos termos antes de usá-los, e progressão lógica. Conteúdo tecnicamente correto mas mal explicado perde aqui.

Âncoras

0Caótico, sem estrutura, ideias soltas

5Dá pra acompanhar com esforço; estrutura implícita

10Estrutura clara, exemplos no momento certo, definições explícitas

Credibilidade

Peso 30%

Fontes, alegações verificáveis, ausência de sensacionalismo. Analisa se o autor cita papers, links, dados reais com fonte, distingue opinião de fato e qualifica afirmações. Catastrofismo, certeza absoluta sobre temas controversos e charlatanismo derrubam a nota aqui.

Âncoras

0Alegações sem fonte, sensacionalismo, charlatanismo

5Mistura fato e opinião sem distinção clara

10Bem-fontado, qualifica afirmações, transparente sobre limites

Originalidade

Peso 10%

Análise própria vs eco do consenso. Penaliza vídeo que apenas reembrulha o que circula nas redes sem adicionar análise, dados próprios ou perspectiva nova. Reconhece quando o autor traz pesquisa primária ou um ângulo incomum.

Âncoras

0Repete consenso, sem ângulo próprio

5Recombina informação conhecida com algum toque pessoal

10Análise primária, ângulo incomum, pesquisa própria

3. Score composto e selos

A média ponderada das 4 dimensões produz um número entre 0 e 10. Esse número se mapeia em 5 selos. As faixas são fixas; não há ajuste editorial.

Fórmula

score = densidade × 0.30
      + clareza    × 0.30
      + credibil.  × 0.30
      + originalid × 0.10

Faixas

ScoreSeloSignificado
9.0 – 10.0ExcepcionalExcepcional — referência no tema
7.5 – 8.9RecomendadoRecomendado — vale o tempo investido
6.0 – 7.4AceitávelAceitável — útil, mas há melhores
4.0 – 5.9FracoFraco — perda de tempo provável
0.0 – 3.9EviteEvite — desinformação ou enrolação

4. Os 28 sinais detectados

Independente do score, o modelo busca 28 padrões no conteúdo. Cada sinal detectado vem com intensidade de 1 a 5 e uma justificativa citando trecho da transcrição como evidência. Sinais não detectados são omitidos — não há "resposta padrão".

Sinais negativos (red flags)

PseudocientíficoTeórico da conspiraçãoSensacionalistaClickbaitAlarmistaDesinformaçãoPropaganda disfarçadaCharlatanismoFanboy/haterDoomscroll baitDogmáticoRage baitDiscriminatórioPolarizadorRecheio/repetitivo

Sinais neutros / descritivos

OpinativoPromocional (declarado)EspeculativoSatíricoStorytelling pessoalPolêmico

Sinais positivos (green flags)

Bem-fontadoEquilibradoDidáticoOriginalTransparenteRigorosoProfundoAtualizado

5. Categorias primárias

Cada vídeo é categorizado em até 3 categorias primárias com confiança 1-5, mais uma subcategoria livre. Essas categorias alimentam os filtros do ranking e dos canais.

EducaçãoTecnologiaNegóciosEntretenimentoNotícias & PolíticaSaúde & Bem-estarCiênciaEstilo de vidaEsportesCulturaConteúdo questionável

6. Ranking de canais — média Bayesiana

O ranking de canais não usa a média simples das notas dos vídeos. Canal com 2 vídeos nota 10 não pode vencer canal com 20 vídeos nota 9.2 — seria injusto estatisticamente. Usamos suavização Bayesiana com prior na média global do período.

Fórmula

              C × M  +  n × x
score_canal = ─────────────────
                 C  +  n

Parâmetros

  • M = média global de todos os scores no período/categoria
  • n = número de vídeos do canal no período
  • x = média simples do canal no período
  • C = peso do prior (5)

Regra do limiar 5.0

Canais com score Bayesiano acima de 5 entram apenas em "melhores". Abaixo de 5, apenas em "piores". Exatamente 5 fica de fora dos dois.

Mínimo de vídeos

Canais com menos de 3 vídeos analisados ficam fora do ranking — amostra insuficiente para qualquer afirmação estatística.

Shorts ficam de fora

YouTube Shorts (vídeos com até 60 segundos) não entram nos rankings nem nas médias agregadas dos canais. A rubrica de 4 dimensões — densidade, clareza, credibilidade, originalidade — não cabe em conteúdo de menos de um minuto. Análises individuais de Shorts continuam disponíveis na página da análise; a exclusão é apenas dos rankings.

7. Limitações conhecidas

A IA não é infalível e nós não escondemos isso. As limitações principais são:

  • A análise se baseia exclusivamente na transcrição em texto. Não vemos imagens, gráficos, slides ou linguagem corporal.
  • Sátira sutil sem disclosure pode ser mal classificada como sensacionalista ou desinformação.
  • Não fazemos checagem ao vivo de fatos contra fontes externas. A credibilidade é avaliada por consistência interna, qualificação de afirmações e citação de fontes pelo próprio autor.
  • A qualidade da transcrição afeta o resultado. Vídeos com legendas auto-geradas de baixa qualidade tendem a receber notas mais conservadoras.
  • O modelo pode ter viés residual nos pesos de labels — fazemos auditorias periódicas e publicamos atualizações nesta página.

Contestação e processo de revisão

Análises do TubeLens são opiniões editoriais com base em metodologia pública. Donos de canal podem contestar qualquer selo, nota ou sinal detectado.

Quem pode contestar

Qualquer pessoa pode reportar erro factual. Donos de canal — verificáveis pela própria conta do YouTube — têm prioridade no processo e direito a resposta personalizada.

O que pode ser contestado

  • Selo final (Excepcional/Recomendado/Aceitável/Fraco/Evite).
  • Nota composta de 0 a 10 ou notas individuais nas 4 dimensões.
  • Sinal detectado específico (ex.: classificou como sensacionalista mas não é).
  • Justificativa que cita trecho da transcrição (erro de interpretação).
  • Categoria primária atribuída.

Como contestar

Envie um email para support@inosx.com com:

  • Link da análise contestada.
  • Item específico em desacordo (selo, nota, sinal, citação).
  • Argumento e — se possível — trecho da transcrição que sustenta sua posição.
  • Identificação do canal, se for o dono.

Prazo e processo

Respondemos em até 5 dias úteis. A revisão é feita por humano, não pela IA original. Possíveis resultados:

  • Re-análise: o vídeo é re-processado e o resultado pode mudar (sobe ou desce).
  • Anotação pública: mantemos a análise mas adicionamos uma nota explicando a contestação e o desfecho.
  • Remoção: raro, reservado a erro factual grave ou conteúdo retirado do YouTube. Mantemos auditoria interna do que foi removido.
  • Manutenção com justificativa: se a metodologia foi aplicada corretamente, mantemos a análise e respondemos com a justificativa detalhada.

Princípios do processo

  • Transparência: todo desfecho é público (na própria análise quando aplicável).
  • Sem retaliação: contestação não rebaixa o canal, não tira ele do ranking, não muda análises futuras a não ser pelo conteúdo dos vídeos novos.
  • Boa fé: assumimos boa fé do contestante. Pedidos repetidos sobre o mesmo ponto sem novo argumento são arquivados após resposta inicial.
  • Processo distinto da análise: a IA não revisa contestações — é sempre revisão humana, justamente para evitar reforço dos vieses do modelo.

TLR · TubeLens Editorial Rating

Inspirações públicas, classificação independente

O TLR — sistema de três eixos (qualidade, faixa etária sugerida, padrão editorial) — foi destilado de princípios públicos consolidados: o questionário da International Age Rating Coalition (IARC) para adequação etária, e os padrões da Federal Communications Commission (FCC §73.1212) e da Federal Trade Commission (FTC Endorsement Guides) norte-americanas para divulgação de patrocínio e veracidade publicitária. TubeLens não é afiliada, endossada nem certificada por nenhuma dessas organizações. Toda classificação é editorial, derivada e independente.

IARC · FCC · FTC

Leituras

A metodologia acima é nossa, mas não inventamos os critérios. Eles são ecos de uma tradição editorial e acadêmica — Goodhart, Kahneman, Pariser, Bellingcat. Documentamos as leituras que sustentam cada decisão metodológica.

Ver bibliografia editorial