BEEspoke Data

community

https://www.bees.org/

AI & ML interests

'an LLM is only as good as the dataset it was trained on' - Sun Tzu

Organization Card

Community About org cards

🐝📊💁

Collections 7

spaces 1

pinned

Running

🐝

BeeCoder Demo

models 49

datasets 63

BEE-spoke-data/synthsumm-comparisons

Viewer • Updated 3 days ago • 4.67k

BEE-spoke-data/fineweb-cinema-100k

Viewer • Updated 3 days ago • 100k

BEE-spoke-data/aimodels.fyi-papers

Viewer • Updated 3 days ago • 14.8k

BEE-spoke-data/smollm-corpus-python

Viewer • Updated 28 days ago • 12.4M • 149

BEE-spoke-data/flan-v2-hf

Viewer • Updated Jul 28 • 819M • 7

BEE-spoke-data/the-stack-smol-xs-all

Viewer • Updated Jul 27 • 8.7k • 4

BEE-spoke-data/the-stack-smol-xs-scored-and-annotated-python

Viewer • Updated Jul 20 • 100 • 2

BEE-spoke-data/upvoteweb-posts

Viewer • Updated Jul 13 • 45.9M • 8

BEE-spoke-data/napierone-pdf-raw

Viewer • Updated Jun 30 • 18.5k • 5

BEE-spoke-data/fineweb-1000_64k

Viewer • Updated Jun 23 • 2k • 15 • 2

BEEspoke Data

AI & ML interests

Collections 7

BEE-spoke-data/smol_llama-101M-GQA

BEE-spoke-data/smol_llama-81M-tied

BEE-spoke-data/smol_llama-220M-GQA

BEE-spoke-data/verysmol_llama-v11-KIx2

BEE-spoke-data/smol_llama-220M-openhermes

BEE-spoke-data/smol_llama-220M-open_instruct

BEE-spoke-data/beecoder-220M-python

BEE-spoke-data/zephyr-220m-sft-full

spaces 1

BeeCoder Demo

models 49

BEE-spoke-data/tFINE-900m-instruct-orpo

BEE-spoke-data/smol_llama-220M-openhermes

BEE-spoke-data/tFINE-900m-e16-d32-instruct

BEE-spoke-data/tFINE-900m-e16-d32-instruct_2e

BEE-spoke-data/tFINE-900m-e16-d32-flan

BEE-spoke-data/slimpajama_tok-48128-BPE-forT5

BEE-spoke-data/claude-tokenizer-forT5

BEE-spoke-data/Meta-Llama-3-8Bee

BEE-spoke-data/MiniTokenizer-20480

BEE-spoke-data/BeeTokenizer

datasets 63

BEE-spoke-data/synthsumm-comparisons

BEE-spoke-data/fineweb-cinema-100k

BEE-spoke-data/aimodels.fyi-papers

BEE-spoke-data/smollm-corpus-python

BEE-spoke-data/flan-v2-hf

BEE-spoke-data/the-stack-smol-xs-all

BEE-spoke-data/the-stack-smol-xs-scored-and-annotated-python

BEE-spoke-data/upvoteweb-posts

BEE-spoke-data/napierone-pdf-raw

BEE-spoke-data/fineweb-1000_64k

AI & ML interests

Team members 8

Collections 7

spaces 1

BeeCoder Demo

models 49 Sort: Recently updated

datasets 63 Sort: Recently updated

models 49

datasets 63