Image Generation

UniLM.jl supports image generation via the OpenAI Images API using models like gpt-image-1.5.

Basic Usage

result = generate_image(
    "A watercolor painting of a friendly robot reading a Julia programming book",
    size="1024x1024",
    quality="medium"
)
println("Success: ", result isa ImageSuccess)
if result isa ImageSuccess
    imgs = image_data(result)
    println("Images: ", length(imgs))
    println("Base64 length: ", length(imgs[1]))
    save_image(imgs[1], joinpath(@__DIR__, "..", "assets", "generated_robot.png"))
    println("Image saved to assets/generated_robot.png")
else
    println("Images: 0")
    println("Image generation failed — see result for details")
end

Success: true
Images: 1
Base64 length: 2947460
Image saved to assets/generated_robot.png

Generated image: A watercolor painting of a friendly robot reading a Julia programming book

The `ImageGeneration` Type

For full control, construct an ImageGeneration object:

ig = ImageGeneration(
    prompt="A minimalist logo for a Julia programming package",
    model="gpt-image-1.5",
    size="1024x1024",
    quality="high",
    background="transparent",
    output_format="png"
)
println("Model: ", ig.model)
println("Size: ", ig.size)
println("Quality: ", ig.quality)
println("\nRequest JSON:")
println(JSON.json(ig))

Model: gpt-image-1.5
Size: 1024x1024
Quality: high

Request JSON:
{"quality":"high","prompt":"A minimalist logo for a Julia programming package","size":"1024x1024","background":"transparent","output_format":"png","model":"gpt-image-1.5"}

Configuration Options

Parameter	Values	Default
`model`	`"gpt-image-1.5"`	`"gpt-image-1.5"`
`size`	`"1024x1024"`, `"1536x1024"`, `"1024x1536"`, `"auto"`	API default
`quality`	`"low"`, `"medium"`, `"high"`, `"auto"`	API default
`background`	`"transparent"`, `"opaque"`, `"auto"`	API default
`output_format`	`"png"`, `"webp"`, `"jpeg"`	API default
`output_compression`	`0`–`100` (for webp/jpeg)	API default
`n`	`1`–`10`	`1`

Multiple Images

Generate multiple images in a single request:

result = generate_image("A cute robot learning to program", n=3, size="1024x1024")

if result isa ImageSuccess
    imgs = image_data(result)
    for (i, img) in enumerate(imgs)
        save_image(img, "robot_$i.png")
    end
end

Transparent Backgrounds

Perfect for logos and icons:

result = generate_image(
    "A simple geometric icon of a butterfly",
    background="transparent",
    output_format="png",
    quality="high"
)

if result isa ImageSuccess
    save_image(image_data(result)[1], "butterfly_icon.png")
    # => PNG with transparent background
end

Result Structure

# Show the type hierarchy for image results
println("ImageSuccess <: ", supertype(ImageSuccess))
println("ImageFailure <: ", supertype(ImageFailure))
println("ImageCallError <: ", supertype(ImageCallError))

ImageSuccess <: LLMRequestResponse
ImageFailure <: LLMRequestResponse
ImageCallError <: LLMRequestResponse

result = generate_image("A sunset over mountains")

if result isa ImageSuccess
    r = result.response

    r.created                 # Unix timestamp
    r.data                    # Vector{ImageObject}
    r.data[1].b64_json        # base64-encoded image data
    r.data[1].revised_prompt  # revised prompt (may be nothing)
    r.usage                   # token usage Dict

    # Convenience accessors
    image_data(result)        # Vector{String} of base64 data
    save_image(image_data(result)[1], "sunset.png")
end

Saving Images

The save_image helper decodes base64 and writes to disk:

# Demonstrate save_image with a tiny test payload
tmpfile = tempname() * ".txt"
UniLM.save_image("aGVsbG8=", tmpfile)  # "hello" in base64
println("File saved to: ", basename(tmpfile))
println("Contents: ", read(tmpfile, String))
rm(tmpfile)

File saved to: jl_NSNkrUJ0pC.txt
Contents: hello

Error Handling

result = generate_image("A sunset over mountains")

if result isa ImageSuccess
    save_image(image_data(result)[1], "sunset.png")
elseif result isa ImageFailure
    @warn "HTTP $(result.status): $(result.response)"
elseif result isa ImageCallError
    @error "Call failed: $(result.error)"
end

generate_image automatically retries on HTTP 429, 500, and 503 errors with exponential backoff and jitter (up to 30 attempts, max 60s delay). On 429 responses, the Retry-After header is respected.