Django-ORM-prefetch_related

JAY.LIN 收录于 Python Django

2025-03-11 约 1446 字预计阅读 3 分钟

https://bing.ee123.net/img/rand?artid=146190830

Django-ORM-prefetch_related

通过 Author 和 Books 两个模型来理解 Django 的 prefetch_related 方法。

探讨如何使用 prefetch_related 来优化查询，避免 N+1 查询问题，

并展示其在处理多对多关系和复杂查询中的强大功能。

模型定义

首先，假设我们有两个模型： Author 和 Book 。一个作者可以写多本书，一本书也可以有多个作者（多对多关系）。

from django.db import models

class Author(models.Model):
    name = models.CharField(max_length=100)

    def __str__(self):
        return self.name

class Book(models.Model):
    title = models.CharField(max_length=100)
    authors = models.ManyToManyField(Author, related_name='books')

    def __str__(self):
        return self.title

N+1 查询问题示例

假设我们想要获取所有作者以及他们所写的书籍。

如果不使用 prefetch_related ，可能会遇到 N+1 查询问题。

# 获取所有作者
authors = Author.objects.all()

for author in authors:
    print(f"Author: {author.name}")
    for book in author.books.all():  # 每个作者都会触发一次数据库查询
        print(f"  Book: {book.title}")

问题分析：

• 第一次查询获取所有作者。

• 对于每个作者，执行一次查询来获取其书籍。

• 如果有 10 个作者，总共会执行 1 + 10 = 11 次查询。

使用 prefetch_related 优化查询

prefetch_related 可以显著减少查询次数。

它会在后台执行额外的查询，并将结果缓存起来，

以便在访问关联对象时不需要额外的数据库查询。

# 使用 prefetch_related 预取每个作者的书籍
authors = Author.objects.prefetch_related('books')

for author in authors:
    print(f"Author: {author.name}")
    for book in author.books.all():  # 现在只执行两次查询
        print(f"  Book: {book.title}")

优化效果：

• 第一次查询获取所有作者。

• 第二次查询获取所有相关的书籍。

• Django 在 Python 层面将这些书籍分配给相应的作者。

• 总共只执行了 2 次查询，无论有多少个作者。

处理更复杂的查询

有时候，我们可能需要预取多个关联字段，或者对预取的数据进行过滤。

这时，可以使用 Prefetch 对象来实现更细粒度的控制。

示例：预取特定条件的书籍

假设我们只想预取每位作者最近出版的 5 本书：

from django.db.models import Prefetch

# 定义一个 Prefetch 对象，过滤并限制预取的书籍数量
recent_books = Prefetch(
    'books',
    queryset=Book.objects.order_by('-id')[:5], # 假设 id 越大，出版时间越近
    to_attr='recent_books'                     # 将预取的书籍存储在 author.recent_books 中
)

authors = Author.objects.prefetch_related(recent_books)

for author in authors:
    print(f"Author: {author.name}")
    for book in author.recent_books:  # 访问预取的书籍
        print(f"  Recent Book: {book.title}")

解释：

• 使用 Prefetch 对象，我们可以自定义预取的查询集。

• to_attr 参数指定了预取的数据存储在模型实例的哪个属性中。

• 这样可以避免加载所有关联对象，只加载我们需要的部分。

示例：预取多个关联字段

如果 Author 模型还有其他关联字段，比如 editor ，我们可以同时预取多个关联：

authors = Author.objects.prefetch_related(
    'books',
    'editor'  # 假设有一个 ForeignKey 字段 'editor'
)

for author in authors:
    print(f"Author: {author.name}")
    for book in author.books.all():
        print(f"  Book: {book.title}")
    if author.editor:
        print(f"  Editor: {author.editor.name}")

性能比较

为了更直观地理解 prefetch_related 的性能优势，我们来看一个简单的性能对比：

import time

# 不使用 prefetch_related
start_time = time.time()
authors = Author.objects.all()
for author in authors:
    for book in author.books.all():
        pass  # 模拟操作
end_time = time.time()
print(f"无 prefetch_related 查询次数: {end_time - start_time} 秒")

# 使用 prefetch_related
start_time = time.time()
authors = Author.objects.prefetch_related('books')
for author in authors:
    for book in author.books.all():
        pass  # 模拟操作
end_time = time.time()
print(f"使用 prefetch_related 查询次数: {end_time - start_time} 秒")

预期结果：

• 不使用 prefetch_related 的情况下，查询时间会随着作者数量的增加而线性增长。

• 使用 prefetch_related 后，查询时间基本保持不变，因为关联数据的查询次数大大减少。

注意事项

适用场景 ： prefetch_related 主要用于处理“多对多”和“一对多”关系。对于“一对一”或“外键”关系，通常使用 select_related 更为高效。
内存消耗 ：由于 prefetch_related 会将所有预取的数据加载到内存中，如果关联数据量非常大，可能会导致内存占用过高。因此，在处理大数据集时需要谨慎使用。
自定义查询 ：通过 Prefetch 对象，可以自定义预取的查询集，如过滤、排序或限制数量，从而进一步优化性能。
链式调用 ： prefetch_related 可以与其他查询优化方法（如 filter 、 exclude 等）结合使用，以满足复杂的查询需求。

总结

prefetch_related 是 Django ORM 提供的一个强大的查询优化工具，特别适用于处理多对多和一对多关系中的 N+1 查询问题。通过预先加载关联对象， prefetch_related 能够显著减少数据库查询次数，提高应用的性能。在使用时，需要根据具体的业务场景选择合适的预取策略，并注意内存消耗等问题，以达到最佳的优化效果。

希望通过以上的解释和示例，你对 django-prefetch_related 有了更深入的理解！

目录

Django-ORM-prefetch_related

Django-ORM-prefetch_related

模型定义

N+1 查询问题示例

使用 prefetch_related 优化查询

处理更复杂的查询

示例：预取特定条件的书籍

示例：预取多个关联字段

性能比较

注意事项

总结

Django-ORM-prefetch_related