我很难优化我的SQLAlchemy查询。我的SQL知识非常基础,我无法从SQLAlchemy文档中获得所需的知识。
假设以下非常基本的一对多关系:
class Parent(Base): __tablename__ = "parents" id = Column(Integer, primary_key = True) children = relationship("Child", backref = "parent") class Child(Base): __tablename__ = "children" id = Column(Integer, primary_key = True) parent_id = Column(Integer, ForeignKey("parents.id")) naughty = Column(Boolean)
我怎么能:
(Parent, count_of_naughty_children, count_of_all_children)
经过相当长的搜索时间后,我发现了如何分别查询这些值:
# The following returns tuples of (Parent, count_of_all_children): session.query(Parent, func.count(Child.id)).outerjoin(Child, Parent.children).\ group_by(Parent.id) # The following returns tuples of (Parent, count_of_naughty_children): al = aliased(Children, session.query(Children).filter_by(naughty = True).\ subquery()) session.query(Parent, func.count(al.id)).outerjoin(al, Parent.children).\ group_by(Parent.id)
我试图以不同的方式将它们组合在一起,但没有设法得到我想要的。
我猜想此查询将基于上一个查询,并按顽皮/所有比率进行过滤。
任何帮助表示赞赏。
编辑: 感谢Antti Haapala的帮助,我找到了第二个问题的解决方案:
avg = func.avg(func.coalesce(Child.naughty, 0)) # coalesce() treats NULLs as 0 # avg = func.avg(Child.naughty) - if you want to ignore NULLs session.query(Parent).join(Child, Parent.children).group_by(Parent).\ having(avg > 0.8)
它找到子naughty变量的平均值,将False和NULL视为0,将True视为1。在MySQL后端进行了测试,但也应该适用于其他变量。
naughty
在count()SQL aggretate功能是相当简单的; 它为您提供每个组中非空值的总数。考虑到这一点,我们可以调整您的查询以为您提供适当的结果。
count()
print (Query([ Parent, func.count(Child.id), func.count(case( [((Child.naughty == True), Child.id)], else_=literal_column("NULL"))).label("naughty")]) .join(Parent.children).group_by(Parent) )
产生以下sql:
SELECT parents.id AS parents_id, count(children.id) AS count_1, count(CASE WHEN (children.naughty = 1) THEN children.id ELSE NULL END) AS naughty FROM parents JOIN children ON parents.id = children.parent_id GROUP BY parents.id