OpenELM | Lab Index

Open Efficient Language Models. 270M to 3B parameter dense Transformers with layer-wise scaling (varying width per layer for parameter efficiency). Fully open: training code, data, weights, and evaluation.

Apple's first open-weight language models. Trained on publicly available data. ICML 2024 workshop. Apache 2.0.

No results found