Postagens

Uma Teoria da Escalabilidade Computacional da Inferência em LLMs

Modelos de Linguagem Grandes (LLMs) demandam recursos computacionais, energéticos e financeiros substanciais tanto no treinamento quanto na implementação. Enquanto as leis de escalabilidade para treinamento guiaram grande parte do progresso recente na área, os custos de inferência representam agora um componente significativo e crescente do ônus geral de recursos, especialmente para modelos focados em raciocínio. Caracterizações existentes de otimalidade computacional que consideram tamanho do modelo, tamanho do conjunto de dados e tokens de inferência isoladamente ou em combinações fixas podem negligenciar pontos de operação mais eficientes. Neste contexto, foi introduzido o Directed Stochastic Skill Search (DS3), uma estrutura geral que representa a inferência como uma travessia estocástica sobre um grafo de habilidades aprendido. A partir de uma instanciação simplificada, mas expressiva, o DS3 permite derivar expressões de forma fechada para o sucesso da tarefa e o custo computac...

Modelos de Separação de Áudio Preservam Informação Espacial em Áudio Binaural?

Uma pesquisa recente publicada no arXiv investiga a capacidade de modelos existentes de separação de fontes musicais (MSS) em preservar a informação espacial presente no áudio binaural. O áudio binaural, embora crucial para experiências imersivas como em realidade virtual e aumentada, bem como para aplicações de acessibilidade, permanece relativamente pouco explorado na comunidade de recuperação de informação musical (MIR). O estudo avaliou o desempenho de diversos modelos populares de MSS. Para isso, foram utilizados tanto conjuntos de dados estéreo padrão quanto novos conjuntos de dados binaurais sintetizados. A criação dos dados binaurais envolveu o uso de *stems* do conjunto MUSDB18-HQ e funções de transferência relacionadas à cabeça (HRTFs) de código aberto, posicionando as fontes instrumentais aleatoriamente no plano horizontal. A avaliação da qualidade espacial dos *stems* separados foi realizada utilizando métricas baseadas em processamento de sinal e em pistas interaurai...

Rastreamento em Tempo Real de Fio-Guia com Redes Siamesas para Procedimentos Endovasculares

Um estudo recente disponível no arquivo arXiv, identificado como arXiv:2507.00051, apresenta um método inovador para o rastreamento em tempo real da ponta de fios-guia durante procedimentos endovasculares guiados por imagem. O artigo, intitulado "Real-Time Guidewire Tip Tracking Using a Siamese Network for Image-Guided Endovascular Procedures", foi desenvolvido por Tianliang Yao, Zhiqiang Pei, Yong Li, Yixuan Yuan e Peng Qi. Os autores propõem a utilização de uma rede siamesa, um tipo de arquitetura de rede neural, para realizar essa tarefa crítica. O rastreamento preciso e em tempo real da ponta do fio-guia é fundamental para a segurança e eficácia dos procedimentos endovasculares, que envolvem a navegação através dos vasos sanguíneos com o auxílio de imagens médicas. A capacidade de determinar a posição exata da ponta do fio-guia em cada momento permite aos médicos tomar decisões mais informadas e precisas, minimizando riscos e melhorando os resultados para os pacientes....

Novas Fronteiras na Cosmologia: Energia Quântica em Limites Tipo Tempo e o Modelo Além do ΛCDM

Um artigo recente publicado no arquivo de pré-publicações arXiv investiga as implicações cosmológicas de uma população de "limites tipo tempo", uma forma de topologia de espaço-tempo não trivial, que contêm uma camada limite de energia de tensão-energia quântica. Este fenômeno, que envolve o acúmulo de flutuações de vácuo de campos quânticos, pode ser consistentemente negativo e sensível ao ultravioleta, apresentando uma nova fonte de densidade de energia cósmica com potencial para competir com a matéria e a energia escura. Os autores, Oliver H. E. Philcox, Eva Silverstein e Gonzalo Torroba, analisam como este efeito contribui com um termo qualitativamente novo para a equação de Friedmann, que dita a história da expansão do universo. Para condições de contorno que permitem um tamanho de limite comóvel fixo, este termo escala com −1/a, onde 'a' é o fator de escala. Notavelmente, esse efeito tende a dominar em tempos relativamente tardios da evolução do universo (em ...

PyMGal: Gerando Observações Ópticas Sintéticas de Simulações Astrofísicas

Um novo pacote Python chamado PyMGal foi desenvolvido para auxiliar pesquisadores em astrofísica na geração de observações ópticas sintéticas a partir de simulações hidrodinâmicas de galáxias. Apresentado no artigo arXiv:2507.00123, de Patrick Janulewicz e Weiguang Cui, o PyMGal visa facilitar a comparação direta entre os resultados de simulações teóricas e os dados obtidos por telescópios reais. O PyMGal funciona lendo as propriedades de partículas estelares de simulações hidrodinâmicas. A partir dessas propriedades, o pacote gera distribuições de energia espectral (SEDs) utilizando uma variedade de modelos de populações estelares que podem ser customizados pelo usuário. Com as SEDs geradas, o programa é capaz de calcular o brilho das partículas em diferentes unidades de saída para centenas de filtros únicos. Uma das principais funcionalidades do PyMGal é a projeção dessas quantidades em um plano 2D, mimetizando uma observação telescópica. O software é compatível com diversos fo...

NeutroSENSE: Detecção de Intrusões em IoT com Lógica Neutrosófica e Abstenção Inteligente

Um novo trabalho de pesquisa intitulado "Deciding When Not to Decide: Indeterminacy-Aware Intrusion Detection with NeutroSENSE" propõe uma abordagem inovadora para a detecção de intrusões em ambientes de Internet das Coisas (IoT). O artigo, assinado por Eyhab Al-Masri, apresenta o NeutroSENSE, uma estrutura de ensemble aprimorada por lógica neutrosófica projetada para ser interpretável e eficaz na identificação de atividades maliciosas. O cerne do NeutroSENSE reside na integração de algoritmos de aprendizado de máquina populares, como Random Forest, XGBoost e Regressão Logística, com a lógica neutrosófica. Essa combinação permite que o sistema não apenas faça previsões sobre a natureza do tráfego de rede (malicioso ou benigno), mas também decomponha a confiança dessa previsão em três componentes: verdade (T), falsidade (F) e indeterminância (I). Essa quantificação da incerteza é um diferencial, pois fornece uma métrica clara (o componente I) para entender o quão incerta é ...

Hypertokens e HDRAM: Nova Memória Associativa para LLMs

Um artigo recente propõe uma nova abordagem para lidar com a aparente perda de precisão em Large Language Models (LLMs), reformulando o problema como uma questão de distribuição de informação no espaço latente. Intitulado "Hypertokens: Holographic Associative Memory in Tokenized LLMs", o estudo introduz a HDRAM (Holographically Defined Random Access Memory) como uma estrutura de memória simbólica inovadora. A pesquisa aborda especificamente o desafio da memória K:V e V:K em LLMs, tratando o espaço latente dos transformadores como um canal de espectro expandido. A HDRAM é construída sobre o conceito de hypertokens, que são códigos simbólicos estruturados que integram códigos corretores de erros (ECC) clássicos, computação holográfica e busca inspirada em computação quântica. Segundo o autor, esta estrutura permite que a HDRAM recupere informações distribuídas através de um processo de "desexpansão" (despreading) baseado em princípios bem definidos. Os hypertoke...