latent-diffusion

An implementation of text-to-image via High-Resolution Image Synthesis with Latent Diffusion Models by Rombach et. al with a focus on training on a TPU-v3-8 VM. Includes full training code for the VAE and DM with minimal changes from the original paper.

Non-cherry-picked generated outputs after 90k steps at batch size 1024, lr=1e-4, ~25 million img subset of laion2B-en:

Loss curve:

Name		Name	Last commit message	Last commit date
Latest commit History 6 Commits
misc		misc
modules		modules
old		old
profile_pics		profile_pics
scripts		scripts
trained_models		trained_models
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

latent-diffusion

About

Releases

Packages

Languages

BearNinja123/latent-diffusion

Folders and files

Latest commit

History

Repository files navigation

latent-diffusion

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages