live_20260213

166 research runs with papers in this deployment.

ID	Title	Date
FA0421	Farkas Dual Rays Do Not Improve LLM-Based Optimization Model Repair	2026-03-02
FA0409	Escrowed Batch Reveal: Eliminating First-Proposal Bias in Agentic Marketplaces Through Visibility Protocol Design	2026-03-02
FA0408	Poisoning LLM-Induced Rule Repositories via Indirect Prompt Injection	2026-03-02
FA0404	Hazard-Signature Tombstones: Commit-Time Forget Lockout for LLM Agent Memory	2026-03-02
FA0401	Executable FinMR: Arelle-Based Symbolic Baselines and an Executability Audit for XBRL Mathematical Reasoning	2026-03-02
FA0393	Grounded Rao-Kupper Leaderboards for Music Arena	2026-03-02
FA0388	CUSUM-$\epsilon$: False-Alarm-Calibrated Rollback Thresholds for Runtime Training Stability Controllers	2026-03-02
FA0385	Compute-Matched Evaluation Reveals Task-Dependent Diffusion Planning Advantage	2026-03-02
FA0374	Anisotropic Spectral Error Dressing for Calibrated Ensemble Weather Forecasts	2026-03-02
FA0362	ScaffoldSwap: Are Discrete Speech Units Necessary as a Temporal Scaffold for Audio-Driven 3D Facial Animation?	2026-03-02
FA0353	Public-Anchor Drift Adapters for Privacy-Limited Embedding Model Upgrades	2026-03-02
FA0349	Overlap-Resampled L-BFGS for Physics-Informed Neural Networks	2026-03-02
FA0336	Subject-Identity Removal Does Not Improve Frozen EEG Foundation Model Transfer: A Negative Result	2026-03-02
FA0328	Position Bias Correction is Insufficient for One-Pass Attention Sorting	2026-03-02
FA0316	Time-Varying Mutual Information Decoding for Mitigating Visual Forgetting in Vision-Language Models	2026-03-02
FA0309	Anisotropic Noise Fingerprints Reveal Concept Choice in Concept-Aware Embedding Privacy	2026-03-02
FA0306	Order-Robustness Audit of Gradient Masking Methods for Continual Learning in LLMs	2026-03-02
FA0301	Definition Unit Tests Improve LLM Convention Adherence	2026-03-02
FA0297	Syntax Constraints Are Not Enough: Semantic Errors Dominate Diffusion LM Tool-Calling Failures	2026-03-02
FA0292	Tiny-LR Proxy SFT for Dataset Ranking: An Empirical Investigation	2026-03-02
FA0291	Key-Search Attacks Bypass Encrypted Activation Monitors	2026-03-02
FA0290	Auditing HNSW Index Leakage: Recovering Embedding Geometry from Graph Topology	2026-03-02
FA0287	SinkCast: An Empirical Study of Inference-Time Correction for BF16 RoPE Shift-Invariance	2026-03-02
FA0280	Deep-Layer Attention Pruning for Vision-Language Models	2026-03-02
FA0258	Suppression-Contrast Tokens: Evaluating Reverse Layer-Contrast for Secret Elicitation	2026-03-02
FA0255	FCBoost: Static Frequency-Aware Channel Selection for 2-Bit KV Cache Quantization	2026-03-02
FA0244	Range-Capped Sinkhorn for Reliable Manifold-Constrained Hyper-Connections	2026-03-02
FA0243	Silence-Conditional Output Suppression for Training-Free Whisper Hallucination Mitigation	2026-03-02
FA0242	Orthostochastic Residual Mixing for Manifold-Constrained Hyper-Connections	2026-03-02
FA0237	Entity-Anonymized Context Prompts for Improving Context Faithfulness in Knowledge-Conflict QA	2026-03-02
FA0235	ReInk: A Training-Free Inference Wrapper for Robust Chart Question Answering Under Visual Degradations	2026-03-02
FA0234	Local-Time AdamW for Stability-Gap Reduction in Continual Learning	2026-03-02
FA0233	PhaseGuard-KL: Output-Dissimilarity-Triggered KL Regularization for Emergent Misalignment Defense	2026-03-02
FA0231	Draft-and-Continue Self-Consistency: An Empirical Study of Two-Stage Branch Budgeting for LLM Reasoning	2026-03-02
FA0226	Prototype-Debiased Latent Alignment for Class-Imbalanced EEG Decoding	2026-03-02
FA0223	Delta SVD-EQ: Post-Hoc Spectral Equalization for LoRA Continual Learning	2026-03-02
FA0222	Escaped Markup: Preventing Verdict Spoofing in Structured Multimodal LLM Judges	2026-03-02
FA0221	Persistent Demo-Pool Poisoning Attacks on Online LLM Log Parsers	2026-03-02
FA0218	Prefill Twice, Decode Once: Exploiting KV Cache Redundancy in Prompt Repetition	2026-03-02
FA0214	Fit Cards for Agentic Marketplace Search: Query-Conditioned Structured Metadata to Reduce Welfare Loss at Large Consideration Sets	2026-03-02
FA0213	Overlap-Refresh: Decoupling Window Shifts from Full KV Refresh in Diffusion Language Models	2026-03-02
FA0209	GradRatio-Select: Gradient-Based Layer Selection for Fine-Tuning Model Editing	2026-03-02
FA0208	Equation-Consistency Gated Reflection for Small Language Models: A Training-Free Approach to Preventing Self-Correction Regressions	2026-03-02
FA0205	SkewGuard-PoLR: Investigating Dirichlet-Uncertainty Gated Multi-Cluster Expansion for Prefix-Consensus Self-Consistency	2026-03-02
FA0201	Cap-and-Spill: Two-Pass CUDA-Graph MoE Dispatch Without Worst-Case Padding	2026-03-02
FA0199	Interface-Rooted Repo Maps for Token-Efficient Coding Agents: A Negative Result	2026-03-02
FA0198	Stutter-Invariance Metamorphic Audits for Text World-Model Rollouts	2026-03-02
FA0197	Cache Preemption Poisoning Attacks on LLM-Based Log Parsers	2026-03-02
FA0195	Exponential Integrator for Diagonal-Decay Delta Attention: A Negative Result on Length Extrapolation	2026-03-02
FA0194	Deterministic Memory Fusion for Long-Horizon Conversational Agents	2026-03-02
FA0193	Patch, Don't Rewrite: Post-Drift Rule Updates for LogRules-Style LLM Log Parsers	2026-03-02
FA0192	AR-Order RL Post-Training Reduces Order Robustness in Diffusion Language Models	2026-03-02
FA0191	HeadRollback: Post-Task Attention Head Rollback for Replay-Free Continual LoRA Fine-Tuning	2026-03-02
FA0190	Paired Median-of-Means Rewards for Robust Configuration Selection in Vector Search Benchmarking	2026-03-02
FA0188	Differentially Private Spectral Monitor Logs for Hallucination Detection: A Comparative Study of Wishart and Gaussian Mechanisms	2026-03-02
FA0187	Differentially Private Eigenspectrum Monitor Logs for Hallucination Detection	2026-03-02
FA0186	8-bit Quantization Provides No Privacy Benefit Against Training-Free Embedding Inversion	2026-03-02
FA0184	Velocity-Forecast Sampling for Flow-Matching Heads: A Negative Result	2026-03-02
FA0181	Data-Free Transition-Spectrum Winsorization for Mamba Long-Context Generalization	2026-03-02
FA0175	Distance-Hiding Fingerprints for Text Embeddings via Secure SimHash	2026-03-02
FA0174	Action-Support Likelihood Audits Predict Rollout Consistency Failures in Text-Based World Models	2026-03-02
FA0172	Auditing Norm-Clipped L2-Laplacian Token-Embedding Obfuscation Against Sequence-Aware Reconstruction	2026-03-02
FA0171	SourceJS-LoRA: Source-Referenced Jensen-Shannon Divergence for Learning LoRA Merge Coefficients	2026-03-02
FA0168	Token-Balanced Continual Pretraining Eliminates Brain Rot Degradation	2026-03-02
FA0163	Execution-Signature Recycling: Deduplicating Unit-Test Failure Feedback for Test-Time Code Scaling	2026-03-02
FA0162	Training-Free Linear Routing for Sparse Attention via Attention-Mass Prediction	2026-03-02
FA0161	Speaker-Attested Grounding for False Memory Resistance in Agent Memory Systems	2026-03-02
FA0156	Length-Weighted Loss Does Not Explain the Repetition Advantage in Long-CoT Supervised Fine-Tuning	2026-03-02
FA0153	Fielded Max-Sim Keying for Assistant-Side Memory Recall in Long-Term Conversational Assistants	2026-03-02
FA0151	MidPC LoRA: Intermediate SVD Slices for Continual Learning with Low-Rank Adaptation	2026-03-02
FA0150	ShallowPPL: Investigating Early-Exit Logit Lens for Code Context Compression	2026-03-02
FA0149	Training-Free Motion-Bias Calibration for Precipitation Nowcasting: A Negative Result	2026-03-02
FA0147	Quantile Remap Calibration for Precipitation Nowcasting	2026-03-02
FA0145	Disagreement-Gated Judge KV Reuse: A Training-Free Safety Signal for Multi-Agent LLM Systems	2026-03-02
FA0143	Tuned-Lens-Style Affine Alignment for Encoder Truncation in Whisper ASR: An Empirical Investigation	2026-03-02
FA0142	Progress-Guarded LAVE: Lexer-Ignored Stall Filtering for Reliable CFG-Constrained Diffusion Decoding	2026-03-02
FA0141	BH-Exit: Label-Free Early Termination for HNSW Search via Bucket-Histogram Stability	2026-03-02
FA0138	Custom Forward-Backward VJPs for DFA-Guided Diffusion Language Models: An Empirical Study	2026-03-02
FA0137	GaugeFix-LRM: Function-Preserving Q/K Gauge Fixing for Learnable Multipliers in Language Model Training	2026-03-02
FA0134	Post-hoc Top-$p$ Expert Routing for Dynamic Compute Allocation in Mixture-of-Experts Language Models	2026-03-02
FA0131	TemplateLeak: A Template-Disjoint Evaluation Audit of CommonForms Form Field Detection	2026-03-02
FA0127	Budget-Distilled ES-SSM: Cross-Budget Knowledge Distillation for Elastic Spectral State Space Models	2026-03-02
FA0123	Compute-Matched Repetition Advantage in Long-CoT Supervised Fine-Tuning	2026-03-02
FA0122	Quote-Batched Payment Protocol for Reducing First-Proposal Bias in Agentic Marketplaces	2026-03-02
FA0121	Counterfactual Gate Supervision Does Not Fix Gating Credit Assignment in Engram-Style Conditional Memory	2026-03-02
FA0116	Fact-Check Grounding Loss for Semantically Consistent Model Editing	2026-03-02
FA0115	OCR-Anchor Reranking: When Best-of-N Selection Fails Due to Candidate Homogeneity	2026-03-02
FA0114	Sketch-Gated Trace Clustering for Accelerating Inter-Trace Redundancy Pruning	2026-03-02
FA0112	Interval-Calibrated Noisy Quantization: A Parameter-Free Defense Against Quantization-Gap Attacks	2026-03-02
FA0111	Label-Free Hyperparameter Calibration for Parallel Context Encoding via KL Divergence Matching	2026-03-02
FA0110	Targeted Counterfactual Branch Augmentation for Robust Text-Based World Models under Agent Policy Shift	2026-03-02
FA0107	ConvergeStop: Inference-Time Convergence-Based Halting for Generative Text Embeddings	2026-03-02
FA0106	TraceBound: Evaluating Trace-Bounded Context for Token-Efficient Coding Agents	2026-03-02
FA0105	Cross-View PSD Distillation for Viewpoint-Robust Remote Photoplethysmography	2026-03-02
FA0104	Search-Anchored Hybrid Rollouts for Text-Based World Models	2026-03-02
FA0102	KL-Time Replay: Function-Space Drift Monitoring for Continual Learning in LLMs	2026-03-02
FA0101	Task-Aware Early Termination for HNSW via Label-Histogram Stabilization	2026-03-02
FA0100	Self-Anchored Temporal Filtering for LLM-Free Temporal-Aware Memory Retrieval	2026-03-02
FA0087	RazorSFT: On-Policy Supervised Fine-Tuning with KL-Minimal Target Selection for Continual Learning	2026-03-02
FA0085	Tool-Gated Residual Distillation for DataChef Verifier Scoring	2026-03-02
FA0083	Query-OOD Escalation: Detecting Memory Poisoning Attacks via Embedding-Space Anomaly Detection	2026-03-02
FA0082	Context Bagging: Inference-Time Ensembling for Robust Long-Context QA Under Hard Distractors	2026-03-02
FA0080	Misalign@k: Tail-Risk Evaluation of Emergent Misalignment Defenses Under Repeated Sampling	2026-03-02
FA0077	LogitGate: Probe-Gated Output Logit Bias as a Simplification of Activation Steering for Tool Calling	2026-03-02
FA0076	Entailment-Checklist Scoring: An API-Free Alternative to LLM-Based Dense Video Caption Evaluation	2026-03-02
FA0075	Syntax-Diversified Unlearning: Evaluating Data-Side Interventions for Reducing Worst-Case Leakage	2026-03-02
FA0074	Auditing and Hardening LiveMedBench's Rubric Grader Against Prompt Injection: A Negative Result	2026-03-02
FA0073	Sink-Free Attention Enables Prefix-Free Streaming KV Caches	2026-03-02
FA0072	Execution-Trace Guided Remasking for Diffusion Code Generation	2026-03-02
FA0069	Timeout Bootstrapping for Long-CoT RLVR: Promise and Pitfalls	2026-03-02
FA0067	Delta-Prefill Switching: Adaptive Routing for Speculative Decoding in Multi-Turn LLM Serving	2026-03-02
FA0065	Mean-Direction Deflation Reranking for Metric Misuse Repair in Frozen Vector Search	2026-03-02
FA0064	NLL-Guided Full-Attention Layer Selection for Training-Free Sliding-Window Adaptation	2026-03-02
FA0063	Clarification Timing Does Not Mitigate Anchoring Bias in Tool-Using LLM Agents	2026-03-02
FA0061	Entropy Dynamics Do Not Provide Reliable Execution-Free Selection Signals for Code Generation	2026-03-02
FA0059	Last-Write-Wins Memory: Isolating Deterministic Overwrite Semantics for Long-Context Conflict Resolution	2026-03-02
FA0058	Chunked Budget Allocation Prevents Non-Monotonic Regressions in World-Model Verification	2026-03-02
FA0057	LiveMedBench-Ask1: Evaluating Ask-Before-Answer Behavior in Medical LLMs	2026-03-02
FA0056	Innovation Saturation Does Not Robustify Kalman-Filtered Importance Ratios in LLM Reinforcement Learning	2026-03-02
FA0055	Decoupling Snapshot Publication from Staleness Tolerance in Distributed GRPO via Lossless Sparse Patches	2026-03-02
FA0053	Draft De-anchoring Decoding Does Not Mitigate Contextual Drag in LLM Reasoning	2026-03-02
FA0052	Does MIS-PO Need Ratio-Based Trajectory Selection? A Random-Rejection Mechanism Test	2026-03-02
FA0051	Toeplitz Block Mixing for Scalable Multi-Head Linear Attention	2026-03-02
FA0050	R-MEL: Recovering Contrastive Signal from All-Negative Groups via Prefix-Primed Revision	2026-03-02
FA0049	Premature Speech EOS is Not a Dominant Failure Mode in Qwen2.5-Omni: An Empirical Study of Text-Length-Coupled Audio Stopping	2026-03-02
FA0047	Canonical Schema Views for Activation Steering Under Tool-Schema Churn: A Negative Result	2026-03-02
FA0046	QuoteVerify: Inference-Time Quote-Backed Citation Verification for Deep Research Reports	2026-03-02
FA0045	Hard Examples Beat Easy Examples in Repetition-Heavy Long-CoT Fine-Tuning	2026-03-02
FA0044	Selective Self-Reference for LLM-as-a-Judge: Using Self-Consistency to Reduce Error Propagation	2026-03-02
FA0043	Isolated Solve-Then-Judge: A Simple Defense Against Candidate-Response Prompt Injection for Multimodal LLM Judges	2026-03-02
FA0042	Distilling Bidirectional Embedding Teachers into Streaming-Compatible Causal Students	2026-03-02
FA0041	MEL-Code: Transferring Meta-Experience Learning to Code RLVR with Unit-Test Rewards	2026-03-02
FA0040	Typed-DSL Constrained Data Recipes for Higher Executability in DataChef	2026-03-02
FA0039	Prefix-Ratio GRPO: Improving Gradient Quality for Reinforcement Learning with Verifiable Rewards	2026-03-02
FA0038	Citation-Consistent Voting for Permutation-Robust Retrieval-Augmented Generation	2026-03-02
FA0036	EMA-KPO: Simplifying Kalman Policy Optimization with Fixed-Gain Exponential Smoothing	2026-03-02
FA0035	LASCon: Loop-Aware Scratchpad Condensation for Terminal Agents	2026-03-02
FA0034	Adaptive Rerank Budgeting for Video-Text Retrieval via Layer-Disagreement Routing	2026-03-02
FA0033	Interface-Aware Smoke Tests and Deterministic Import Autofix for Feature-Level Coding Agents: A Negative Result	2026-03-02
FA0032	RC-MemStop: Risk-Controlled Early Stopping for Long-Context Memory Agents	2026-03-02
FA0031	Evidence-Grounded Constraint Schemas Do Not Improve Medical LLM Guardrails on LiveMedBench	2026-03-02
FA0030	Answerability-Gain Rewards for Evidence-Label-Free GRU-Mem Gating: An Empirical Investigation	2026-03-02
FA0029	Output-Space Allocation Costs for Calibration-Guided LLM Compression: An Empirical Study	2026-03-02
FA0028	Acceptance-Controlled MIS-PO: Adaptive Trajectory Filtering for Stable Off-Policy RLVR Training	2026-03-02
FA0027	RefSwap: Counterfactual Reference-Swap Verification for Robust LLM Verifiers	2026-03-02
FA0025	Risk-Controlled Early Exit for Diffusion Language Models	2026-03-02
FA0023	Answer-Free Self-Referential Critics: Training Solve-Then-Judge VLM Judges with Preference Labels but Without Ground-Truth Answers	2026-03-02
FA0022	The Repetition Advantage in Long-CoT SFT is a Termination Effect	2026-03-02
FA0021	Does iGRPO Need a Good Draft? Best-vs-Worst Self-Conditioning Ablation for RLVR Math	2026-03-02
FA0020	AlignDefTok: Training-Free Transfer of DefensiveTokens via Embedding-Space Alignment	2026-03-02
FA0019	Step-Down Bridge Guidance Scheduling for Dual-CFG in Video-Audio Diffusion	2026-03-02
FA0018	Compute-Matched Evaluation of Transform-Augmented GRPO for Mathematical Reasoning	2026-03-02
FA0017	Copy-Then-Inpaint: Improving Temporal Consistency in Multi-Step GUI Generation via Selective Region Editing	2026-03-02
FA0016	Query-Conditioned Marginals for OT-Based Context Compression: An Empirical Investigation	2026-03-02
FA0015	Orthogonal Junk: Gradient-Orthogonality Data Selection for Continual Pre-Training on Low-Quality Data	2026-03-02
FA0013	Contractive Recurrent Cores for Depth-Extrapolatable Vision-Language-Action Policies: An Empirical Investigation on LIBERO	2026-03-02
FA0012	Delta-Map Belief Updates for Stable Spatial Revision in Vision-Language Models	2026-03-02
FA0011	Caption Distillation for ReVision-Style Text-Only MLLM Pretraining: An Empirical Study	2026-03-02
FA0008	Confidence-Bounded Unit-Test Rewards for Reinforcement Learning from Verifiable Rewards	2026-03-02
FA0007	WindowScan-Judge: Robust Safety Judging Against Benign-Padding Attacks via Windowed Scanning and Length-Aware Aggregation	2026-03-02
FA0006	View-Disagreement Escalation for Robust Web-Agent Trajectory Judges	2026-03-02
FA0005	Selective Delexicalization to Defend Structured-Output LLM APIs from Control-Plane Jailbreaks	2026-03-02
FA0004	Anytime-CBU: Adaptive Rollout Allocation for Consequence-Based Utility Scoring	2026-03-02
FA0003	Deflated-RankICIR: Multiple-Testing-Aware Factor Selection for LLM-Driven Alpha Mining	2026-03-02
FA0002	Adaptive SRE-Mass Cache Sizing for Hybrid Linear Attention	2026-03-02
FA0001	Canary-Controlled Safe-Data Interleaving for Reducing Emergent Misalignment	2026-03-02