$\sum$ 記号の使い方
2022-09-10
ここでは、行列式の定義や計算でも頻繁にでてくる \(\sum\) 記号の使い方についておさらいしておくことにします。
\(\sum\) 記号をつかういくつかの動機
たとえば、\(4\) 個の数 \(a_1,a_2,a_3,a_4\) をすべて足したものは和の記号 \(+\) を使って、 \[a_1+a_2+a_3 +a_4\] とあらわされます。
また、\(9\) 個の数 \(a_1,a_2,a_3,a_4,a_5,a_6,a_7,a_8,a_9\) をすべて足したものはやはり和の記号 \(+\) を使って、\[a_1+a_2+a_3+a_4+a_5+a_6+a_7+a_8+a_9\]
とあらわされますが、かなり横長になってしまいます。
そこで、\(\cdots\) を使って途中を省略し、 \[a_1+a_2+\cdots+a_9\] と書いたりします。そして、この式では省略したところに何が書いてあるのかは明白です。
今度は\[(a_1+a_2+\cdots+a_{9})(b_1+b_2+\cdots+b_{7})\]
\[\begin{align} &(a_1+a_2+\cdots+a_9)(b_1+b_2+\cdots+b_7)\\ =&a_1b_1+a_1b_2+\cdots + a_1b_7 + a_2b_1+a_2b_2 +\cdots + a_2b_7+\cdots + a_9b_1+a_9b_2+\cdots a_9b_7\end{align}\]
のようになりますが、このように、展開した結果を1行で書くと横長になりすぎ、しかも \(\cdots\) のところは何を省略したのかパット見ではわかりにくくなります。
そこで、展開の結果を1行で書くのはやめて、\[\begin{align} &(a_1+a_2+\cdots+a_9)(b_1+b_2+\cdots+b_7)\\[6pt] &=\quad a_1b_1+a_1b_2+\cdots + a_1b_7 \\[6pt] & \qquad + a_2b_1+a_2b_2 +\cdots + a_2b_7\\[6pt] & \qquad + \quad \qquad \cdots\cdots\cdots\\[6pt] & \qquad + \quad \qquad \cdots\cdots\cdots\\[6pt] & \qquad + a_9b_1+a_9b_2+\cdots +a_9b_7 \end{align}\]
のように書くと、\(\cdots\) のところは何を省略したのかそれなりにわかりやすくなりますが、今度は縦に長く書くことになります。
このような式では、どのような項が足されているのかさえわかれば良いので、もう少しよい書き表し方があると便利です。そんな時に \(\sum\) という記号が使われます。
\(\sum\) 記号の使い方
添字が1つのものすべての和をあらわすには
\(n\) 個の数 \(a_1,a_2,\ldots,a_n\) をすべて足したものは \[a_1+a_2+\cdots +a_n\] と書けば良いわけですが、これを縮めて \[\sum_{k=1}^n a_k\] と書きあらわすことがよくおこなわれます。
この、\(\displaystyle{\sum_{k=1}^n a_k}\) という記号はには次のような意味が込められています。
- \(\sum\) は、この記号の後ろに書いてある \(a_k\) たちすべてを足してくださいとう命令です。
- \(\sum\) の下に \({k=1}\)、\(\sum\) の上に \(n\) と書くことによって、添字 \(k\) は \(1,2,\cdots,n\) の範囲の値に変化できるということを示しています。
というわけで、\(\displaystyle{\sum_{k=1}^n a_k}\) と書いてあるのを見たら、
「\(a_1,a_2,\ldots,a_n\) を全部足したものだな」
と思うようにしてください。
添字が複数のものすべての和をあらわすには
次のような、添字を2つもつ \(n\times m\) 個の数\[a_{11},a_{12},\ldots,a_{1m},a_{21},a_{22},\ldots,a_{2m},\cdots,a_{n1},a_{n2},\ldots,a_{nm}\]
\[ \begin{align} &a_{11}+a_{12}+\cdots+a_{1m}\\[6pt] &+ a_{21}+a_{22}+\cdots+a_{2m}\\[6pt] &+ \qquad\quad\quad\cdots\\[6pt] &+ a_{n1}+a_{n2}+\cdots+a_{nm} \end{align} \]
と書けば良いわけですが、これを縮めて
\[ \sum_{\begin{array}{c}1 \leq k \leq n \\1\leq l \leq m\end{array}}a_{kl}\]
と書くことがよくあります。
この、 \(\displaystyle{\sum_{\begin{array}{c}1 \leq k \leq n\\1\leq l \leq m\end{array}}a_{kl}}\) という記号はには次のような意味が込められています。
- \(\sum\) は、この記号の後ろに書いてある \(a_{kl}\) たちすべて足してくださいとう命令です。
- \(\sum\) の下に \(1 \leq k \leq n\) と \(1 \leq l \leq m\) を書くことによって、添字 \(k\) は \(1,2,\cdots,n\) の範囲の値に、添字 \(l\) は \(1,2,\cdots,m\) の範囲の値に変化できるということを示しています。
というわけで、 \(\displaystyle{\sum_{\begin{array}{c}1 \leq k \leq n\\1\leq l \leq m\end{array}}a_{kl}}\) と書いてあるのを見たら、
「\(a_{kl}\;(k=1,2,\cdots,n;\:l=1,2,\cdots,m)\) を全部足したものだな」
と思うようにしてください。
補足:この流儀を使うと、添字が1つの場合、\(a_1+a_2+\cdots +a_n\) は、 \[\sum_{1 \leq k \leq n}a_{k}\] とあらわして良いことになります。
ここまで理解ができた人にとってはもう、例えば添字が3つの場合の、 \[\sum_{\begin{array}{c}1 \leq s \leq n\\1 \leq t \leq m\\1\leq u \leq p\end{array}}a_{stu}\] が何を意味するのか明らかですね。
例
\((a_1+a_2+\cdots+a_9)(b_1+b_2+\cdots+b_7)\) の展開を考えてみましょう。\[ \begin{align} &(a_1+a_2+\cdots+a_9)(b_1+b_2+\cdots+b_7)\\[6pt] &=a_1b_1+a_1b_2+\cdots + a_1b_7 \\[6pt] &\quad+ a_2b_1+a_2b_2 +\cdots + a_2b_7\\[6pt] &\quad+ \qquad\qquad\cdots \cdots\cdots\\[6pt] &\quad+ \qquad\qquad\cdots \cdots\cdots\\[6pt] &\quad+ a_9b_1+a_9b_2+\cdots +a_9b_7 \end{align}\tag{1} \]
となります。
分配法則を思い出して展開という計算の仕組みをよく考えてみると、展開の結果は、\(a_1,a_2,\cdots,a_9\) からどれか1つを選び、\(b_1,b_2, \cdots,b_7\) からどれか1つを選び、そしてそれらを掛けてできる項すべての和になることがわかります。つまり、\[a_sb_t \:(\text{ただし}\,s=1,2,\ldots,9\,;\:t=1,2,\ldots,7)\]
\[ \left(\sum_{s=1}^{9}a_s\right)\left(\sum_{t=1}^{7}b_t\right)=\sum_{\begin{array}{c}1 \leq s \leq 9\\1 \leq t \leq 7\end{array}}a_sb_t\tag{2} \]
と書いて良いということも理解できると思います。
\((2)\) 式は \((1)\) 式を \(\sum\) 記号を使って縮めて書いているだけです。 ですから、\((2)\) 式を見たら \((1)\) 式を思い浮かべられるようにしておく必要があります。
添字が変化する範囲を集合の記号であらわす
いま集合 \(U\) を \(1\) から \(n\) までの自然数の集合とします。 つまり、 \[U=\{1,2,\ldots,n\}\] とします。 \(1,2,\ldots, n\) はどれももちろん \(U\) の要素ですから、 \(\in\) という記号を使って、\[1 \in U,2 \in U,\cdots,n \in U\]
というように書くことができます。
また、ある数 \(k\) が \(U\) の要素であるということを \[ k \in U\] と書くことができます。
以上のことを踏まえた上で、\(a_1+a_2+\cdots +a_n\) というを \(\sum\) 記号を使って、 \[\sum_{k \in \{1,2,\ldots,n\}}a_{k} \] や \[\sum_{k \in U}a_{k} \quad \text{ただし}\,\, U=\{1,2,\ldots,n\}\] のように書くことがあります。
交換法則や分配法則と\(\sum\) 記号
たし算の交換法則と\(\sum\) 記号
2組の \(n\) 個の数があるとし、それらを \(a_1,a_2,\ldots,a_n\)、\(b_1,b_2,\ldots,b_n\) としましょう。
たし算は順番を自由に変えられますから、\[(a_1+b_1)+(a_2+b_2)+\cdots+(a_n+b_n) =(a_1 + a_2 +\cdots + a_n)+(b_1 + b_2 +\cdots + b_n) \tag{3}\]
\[\sum_{k=1}^n(a_k+b_k)=\sum_{k=1}^n a_k +\sum_{k=1}^n b_k\tag{4}\]
となります。
\((4)\) 式は \((3)\) 式を \(\sum\) 記号を使って縮めて書いているだけです。ですから、\((4)\) 式を見たら \((3)\) 式を思い浮かべられるようにしておく必要があります。
分配法則と\(\sum\) 記号
\(n\) 個の数 \(a_1,a_2,\ldots,a_n\) と1つの数 \(r\) があるとしましょう。
分配法則によると、\[ra_1+ra_2+\cdots+ra_n =r(a_1 + a_2 +\cdots + a_n)\tag{5}\]
\[\sum_{k=1}^nra_k=r\sum_{k=1}^n a_k\tag{6}\]
となります。
\((6)\) 式は \((5)\) 式を \(\sum\) 記号を使って縮めて書いているだけです。ですから、\((6)\) 式を見たら \((5)\) 式を思い浮かべられるようにしておく必要があります。
また、\[a_1r+a_2r+\cdots+a_nr=(a_1 + a_2 +\cdots + a_n)r\tag{7}\]
\[\sum_{k=1}^na_k r=\left(\sum_{k=1}^n a_k\right) r\tag{8}\]
となります。
\((8)\) 式は \((7)\) 式を\(\sum\) 記号を使って縮めて書いているだけです。ですから、\((8)\) 式を見たら \((7)\) 式を思い浮かべられるようにしておく必要があります。
\(\sum\) 記号がいくつも含まれる式
それではここで、練習のため複数の \(\sum\) 記号が含まれる見かけが複雑な式を考えてみることにします。
以下、4つの式が出てきますが、どれも \(a_*\) の添字 \(*\) は \(1\) から \(m\) まで、\(b_\star\) の添字 \(\star\) は \(1\) から \(n\) まで変ることができるとしています。それぞれの式の正体を考えてみることにしますが、直前の「分配法則と\(\sum\) 記号」で学んだことも思い出して計算をたどってみてください。
- \(\displaystyle{\sum_{k=1}^{m}\left\{ a_k\sum_{l=1}^{n}b_l\right\}}\) の正体
\[ \begin{align} \sum_{k=1}^{m}\left\{ a_k\sum_{l=1}^{n}b_t\right\}&= \sum_{k=1}^{m}\left\{ a_k(b_1+b_2+\cdots+b_n)\right\}\\[6pt] &=a_1(b_1+b_2+\cdots+b_n)\\[6pt] &\quad+a_2(b_1+b_2+\cdots+b_n)\\[6pt] &\quad +\quad\cdots\cdots\cdots\cdots\cdots\cdots\\[6pt] &\quad+a_m(b_1+b_2+\cdots+b_n)\\[6pt] \end{align} \]
- \(\displaystyle{\sum_{t=1}^{n}\left\{\left(\sum_{s=1}^{m}a_s\right)b_t\right\}}\) の正体
\[\begin{align} \sum_{t=1}^{n}\left\{\left(\sum_{s=1}^{m}a_s\right)b_t\right\}&=\sum_{t=1}^{n}\{(a_1+a_2 + \cdots +a_m)b_t \}\\[6pt] &= (a_1+a_2 + \cdots +a_m)b_1\\[6pt] &\quad +(a_1+a_2 + \cdots +a_m)b_2\\[6pt] &\quad +\quad\cdots\cdots\cdots\cdots\cdots\cdots\\[6pt] &\quad +(a_1+a_2 + \cdots +a_m)b_n \end{align}\]
- \(\displaystyle{\sum_{q=1}^{n}\left(\sum_{p=1}^{m}a_pb_q\right)}\)の正体
\[\begin{align} \sum_{q=1}^{n}\left(\sum_{p=1}^{m}a_pb_q\right) &=\sum_{q=1}^{m}(a_1b_q +a_2b_q+\cdots a_mb_q)\\[6pt] &=(a_1b_1 +a_2b_1+\cdots a_mb_1)\\[6pt] &\quad+(a_1b_2 +a_2b_2+\cdots a_mb_2)\\[6pt] &\quad +\quad\cdots\cdots\cdots\cdots\cdots\cdots\\[6pt] &\quad +(a_1b_n +a_2b_n+\cdots a_mb_n)\\[6pt] \end{align}\]
- \(\displaystyle{\sum_{i=1}^{m}\left(\sum_{j=1}^{n}a_ib_j\right)}\)の正体
\[\begin{align} \sum_{i=1}^{m}\left(\sum_{j=1}^{n}a_ib_j\right) &=\sum_{i=1}^{m}(a_ib_1 +a_ib_2+\cdots a_ib_n)\\[6pt] &=(a_1b_1 +a_1b_2+\cdots a_1b_n)\\[6pt] &\quad+(a_2b_1 +a_2b_2+\cdots a_2b_n)\\[6pt] &\quad +\quad\cdots\cdots\cdots\cdots\cdots\cdots\\[6pt] &\quad+(a_mb_1 +a_mb_2+\cdots a_mb_n)\\ \end{align}\]
\[\sum_{\begin{array}{c}1 \leq k \leq m\\ 1\leq l \leq n\end{array}}a_{k}b_{l}\]
と同じになってしまうことがわかるでしょう。
ところで、\(\displaystyle{\sum_{\begin{array}{c}1 \leq k \leq m\\1\leq l \leq n\end{array}}a_{k}b_{l}}\) は、誤解の恐れないとき、 \[\sum_{k=1}^{m}\sum_{l=1}^{n}a_kb_l\] のように2重の\(\sum\) 記号で曖昧な書き方をすることがあります。
ここで \(\displaystyle{\sum_{\begin{array}{c}1 \leq k \leq m\\1\leq l \leq n\end{array}}a_{k}b_{l}}\) は \((a_1 + \cdots + a_m)(b_1 + \cdots + b_n)\) を展開した結果を縮めて書いただけということを思い出すと、\[\sum_{k=1}^{m}\sum_{l=1}^{n}a_kb_l = \sum_{k=1}^{m}a_k\sum_{l=1}^{n}b_l\]
のように書き換えても良いことが理解できるでしょう。
変化する添字はどんな文字を使っても良いということ
\(a_1+a_2+\cdots +a_n\) を\(\sum\) 記号を使って \(\displaystyle{\sum_{k=1}^n a_k}\) のように縮めて書くとき、 変化する添字はどんな文字を使っても構いません。 変化する添字を \(k\) にして \(\displaystyle{\sum_{k=1}^n a_k}\) と書こうが、変化する添字を \(l\) にして \(\displaystyle{\sum_{l=1}^n a_l}\) と書こうが、結局それらの正体は \(a_1+a_2+\cdots +a_n\) だからです。
まとめ
添字を持つ複数の数があるとき、それらの和を横長にならないように短縮して書くために \(\Sigma\) 記号が使われます。
\(\Sigma\) 記号を用いて書かれている式の正体を考え、数の世界で成り立っている交換法則や分配法則を思い出すと、\(\Sigma\) 記号の入った式では\(\Sigma\) 記号を分配したり移動したりして式の見かけを変えられることが理解できます。
\(\Sigma\) 記号を用いて書かれている式では変化する添字はどんな文字を使っても構いません。