6c0df3da4f4478532333fb1e9f306804855e411c
[gnus] / lisp / sha1-el.el
1 ;;; sha1-el.el --- SHA1 Secure Hash Algorithm in Emacs-Lisp.
2
3 ;; Copyright (C) 1999, 2001, 2003  Free Software Foundation, Inc.
4
5 ;; Author: Shuhei KOBAYASHI <shuhei@aqua.ocn.ne.jp>
6 ;; Keywords: SHA1, FIPS 180-1
7
8 ;; This file is part of FLIM (Faithful Library about Internet Message).
9
10 ;; This program is free software; you can redistribute it and/or
11 ;; modify it under the terms of the GNU General Public License as
12 ;; published by the Free Software Foundation; either version 2, or
13 ;; (at your option) any later version.
14
15 ;; This program is distributed in the hope that it will be useful,
16 ;; but WITHOUT ANY WARRANTY; without even the implied warranty of
17 ;; MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
18 ;; GNU General Public License for more details.
19
20 ;; You should have received a copy of the GNU General Public License
21 ;; along with this program; see the file COPYING.  If not, write to
22 ;; the Free Software Foundation, Inc., 59 Temple Place - Suite 330,
23 ;; Boston, MA 02111-1307, USA.
24
25 ;;; Commentary:
26
27 ;; This program is implemented from the definition of SHA-1 in FIPS PUB
28 ;; 180-1 (Federal Information Processing Standards Publication 180-1),
29 ;; "Announcing the Standard for SECURE HASH STANDARD".
30 ;; <URL:http://www.itl.nist.gov/div897/pubs/fip180-1.htm>
31 ;; (EXCEPTION; two optimizations taken from GnuPG/cipher/sha1.c)
32 ;;
33 ;; Test cases from FIPS PUB 180-1.
34 ;;
35 ;; (sha1 "abc")
36 ;; => a9993e364706816aba3e25717850c26c9cd0d89d
37 ;;
38 ;; (sha1 "abcdbcdecdefdefgefghfghighijhijkijkljklmklmnlmnomnopnopq")
39 ;; => 84983e441c3bd26ebaae4aa1f95129e5e54670f1
40 ;;
41 ;; (sha1 (make-string 1000000 ?a))
42 ;; => 34aa973cd4c4daa4f61eeb2bdbad27316534016f
43 ;;
44 ;; BUGS:
45 ;;  * It is assumed that length of input string is less than 2^29 bytes.
46 ;;  * It is caller's responsibility to make string (or region) unibyte.
47 ;;
48 ;; TODO:
49 ;;  * Rewrite from scratch!
50 ;;    This version is much faster than Keiichi Suzuki's another sha1.el,
51 ;;    but it is too dirty.
52
53 ;;; Code:
54
55 (require 'hex-util)
56
57 (ignore-errors (autoload 'executable-find "executable"))
58
59 ;;;
60 ;;; external SHA1 function.
61 ;;;
62
63 (defgroup sha1 nil
64   "Elisp interface for SHA1 hash computation."
65   :group 'extensions)
66
67 (defcustom sha1-maximum-internal-length 500
68   "*Maximum length of message to use lisp version of SHA1 function.
69 If message is longer than this, `sha1-program' is used instead.
70
71 If this variable is set to 0, use extarnal program only.
72 If this variable is set to nil, use internal function only."
73   :type 'integer
74   :group 'sha1)
75
76 (defcustom sha1-program '("sha1sum")
77   "*Name of program to compute SHA1.
78 It must be a string \(program name\) or list of strings \(name and its args\)."
79   :type '(repeat string)
80   :group 'sha1)
81
82 (defcustom sha1-use-external (ignore-errors
83                                (executable-find (car sha1-program)))
84   "*Use external SHA1 program.
85 If this variable is set to nil, use internal function only."
86   :type 'boolean
87   :group 'sha1)
88
89 (defun sha1-string-external (string)
90   ;; `with-temp-buffer' is new in v20, so we do not use it.
91   (save-excursion
92     (let (buffer)
93       (unwind-protect
94           (let (prog args)
95             (if (consp sha1-program)
96                 (setq prog (car sha1-program)
97                       args (cdr sha1-program))
98               (setq prog sha1-program
99                     args nil))
100             (setq buffer (set-buffer
101                           (generate-new-buffer " *sha1 external*")))
102             (insert string)
103             (apply (function call-process-region)
104                    (point-min)(point-max)
105                    prog t t nil args)
106             ;; SHA1 is 40 bytes long in hexadecimal form.
107             (buffer-substring (point-min)(+ (point-min) 40)))
108         (and buffer
109              (buffer-name buffer)
110              (kill-buffer buffer))))))
111
112 (defun sha1-region-external (beg end)
113   (sha1-string-external (buffer-substring-no-properties beg end)))
114
115 ;;;
116 ;;; internal SHA1 function.
117 ;;;
118
119 (eval-when-compile
120   ;; optional second arg of string-to-number is new in v20.
121   (defconst sha1-K0-high 23170)         ; (string-to-number "5A82" 16)
122   (defconst sha1-K0-low  31129)         ; (string-to-number "7999" 16)
123   (defconst sha1-K1-high 28377)         ; (string-to-number "6ED9" 16)
124   (defconst sha1-K1-low  60321)         ; (string-to-number "EBA1" 16)
125   (defconst sha1-K2-high 36635)         ; (string-to-number "8F1B" 16)
126   (defconst sha1-K2-low  48348)         ; (string-to-number "BCDC" 16)
127   (defconst sha1-K3-high 51810)         ; (string-to-number "CA62" 16)
128   (defconst sha1-K3-low  49622)         ; (string-to-number "C1D6" 16)
129
130 ;;; original definition of sha1-F0.
131 ;;; (defmacro sha1-F0 (B C D)
132 ;;;   (` (logior (logand (, B) (, C))
133 ;;;          (logand (lognot (, B)) (, D)))))
134 ;;; a little optimization from GnuPG/cipher/sha1.c.
135   (defmacro sha1-F0 (B C D)
136     (` (logxor (, D) (logand (, B) (logxor (, C) (, D))))))
137   (defmacro sha1-F1 (B C D)
138     (` (logxor (, B) (, C) (, D))))
139 ;;; original definition of sha1-F2.
140 ;;; (defmacro sha1-F2 (B C D)
141 ;;;   (` (logior (logand (, B) (, C))
142 ;;;          (logand (, B) (, D))
143 ;;;          (logand (, C) (, D)))))
144 ;;; a little optimization from GnuPG/cipher/sha1.c.
145   (defmacro sha1-F2 (B C D)
146     (` (logior (logand (, B) (, C))
147                (logand (, D) (logior (, B) (, C))))))
148   (defmacro sha1-F3 (B C D)
149     (` (logxor (, B) (, C) (, D))))
150
151   (defmacro sha1-S1  (W-high W-low)
152     (` (let ((W-high (, W-high))
153              (W-low  (, W-low)))
154          (setq S1W-high (+ (% (* W-high 2) 65536)
155                            (/ W-low (, (/ 65536 2)))))
156          (setq S1W-low (+ (/ W-high (, (/ 65536 2)))
157                           (% (* W-low 2) 65536))))))
158   (defmacro sha1-S5  (A-high A-low)
159     (` (progn
160          (setq S5A-high (+ (% (* (, A-high) 32) 65536)
161                            (/ (, A-low) (, (/ 65536 32)))))
162          (setq S5A-low  (+ (/ (, A-high) (, (/ 65536 32)))
163                            (% (* (, A-low) 32) 65536))))))
164   (defmacro sha1-S30 (B-high B-low)
165     (` (progn
166          (setq S30B-high (+ (/ (, B-high) 4)
167                             (* (% (, B-low) 4) (, (/ 65536 4)))))
168          (setq S30B-low  (+ (/ (, B-low) 4)
169                             (* (% (, B-high) 4) (, (/ 65536 4))))))))
170
171   (defmacro sha1-OP (round)
172     (` (progn
173          (sha1-S5 sha1-A-high sha1-A-low)
174          (sha1-S30 sha1-B-high sha1-B-low)
175          (setq sha1-A-low (+ ((, (intern (format "sha1-F%d" round)))
176                               sha1-B-low sha1-C-low sha1-D-low)
177                              sha1-E-low
178                              (, (symbol-value
179                                  (intern (format "sha1-K%d-low" round))))
180                              (aref block-low idx)
181                              (progn
182                                (setq sha1-E-low sha1-D-low)
183                                (setq sha1-D-low sha1-C-low)
184                                (setq sha1-C-low S30B-low)
185                                (setq sha1-B-low sha1-A-low)
186                                S5A-low)))
187          (setq carry (/ sha1-A-low 65536))
188          (setq sha1-A-low (% sha1-A-low 65536))
189          (setq sha1-A-high (% (+ ((, (intern (format "sha1-F%d" round)))
190                                   sha1-B-high sha1-C-high sha1-D-high)
191                                  sha1-E-high
192                                  (, (symbol-value
193                                      (intern (format "sha1-K%d-high" round))))
194                                  (aref block-high idx)
195                                  (progn
196                                    (setq sha1-E-high sha1-D-high)
197                                    (setq sha1-D-high sha1-C-high)
198                                    (setq sha1-C-high S30B-high)
199                                    (setq sha1-B-high sha1-A-high)
200                                    S5A-high)
201                                  carry)
202                               65536)))))
203
204   (defmacro sha1-add-to-H (H X)
205     (` (progn
206          (setq (, (intern (format "sha1-%s-low" H)))
207                (+ (, (intern (format "sha1-%s-low" H)))
208                   (, (intern (format "sha1-%s-low" X)))))
209          (setq carry (/ (, (intern (format "sha1-%s-low" H))) 65536))
210          (setq (, (intern (format "sha1-%s-low" H)))
211                (% (, (intern (format "sha1-%s-low" H))) 65536))
212          (setq (, (intern (format "sha1-%s-high" H)))
213                (% (+ (, (intern (format "sha1-%s-high" H)))
214                      (, (intern (format "sha1-%s-high" X)))
215                      carry)
216                   65536)))))
217   )
218
219 ;;; buffers (H0 H1 H2 H3 H4).
220 (defvar sha1-H0-high)
221 (defvar sha1-H0-low)
222 (defvar sha1-H1-high)
223 (defvar sha1-H1-low)
224 (defvar sha1-H2-high)
225 (defvar sha1-H2-low)
226 (defvar sha1-H3-high)
227 (defvar sha1-H3-low)
228 (defvar sha1-H4-high)
229 (defvar sha1-H4-low)
230
231 (defun sha1-block (block-high block-low)
232   (let (;; step (c) --- initialize buffers (A B C D E).
233         (sha1-A-high sha1-H0-high) (sha1-A-low sha1-H0-low)
234         (sha1-B-high sha1-H1-high) (sha1-B-low sha1-H1-low)
235         (sha1-C-high sha1-H2-high) (sha1-C-low sha1-H2-low)
236         (sha1-D-high sha1-H3-high) (sha1-D-low sha1-H3-low)
237         (sha1-E-high sha1-H4-high) (sha1-E-low sha1-H4-low)
238         (idx 16))
239     ;; step (b).
240     (let (;; temporary variables used in sha1-S1 macro.
241           S1W-high S1W-low)
242       (while (< idx 80)
243         (sha1-S1 (logxor (aref block-high (- idx 3))
244                          (aref block-high (- idx 8))
245                          (aref block-high (- idx 14))
246                          (aref block-high (- idx 16)))
247                  (logxor (aref block-low  (- idx 3))
248                          (aref block-low  (- idx 8))
249                          (aref block-low  (- idx 14))
250                          (aref block-low  (- idx 16))))
251         (aset block-high idx S1W-high)
252         (aset block-low  idx S1W-low)
253         (setq idx (1+ idx))))
254     ;; step (d).
255     (setq idx 0)
256     (let (;; temporary variables used in sha1-OP macro.
257           S5A-high S5A-low S30B-high S30B-low carry)
258       (while (< idx 20) (sha1-OP 0) (setq idx (1+ idx)))
259       (while (< idx 40) (sha1-OP 1) (setq idx (1+ idx)))
260       (while (< idx 60) (sha1-OP 2) (setq idx (1+ idx)))
261       (while (< idx 80) (sha1-OP 3) (setq idx (1+ idx))))
262     ;; step (e).
263     (let (;; temporary variables used in sha1-add-to-H macro.
264           carry)
265       (sha1-add-to-H H0 A)
266       (sha1-add-to-H H1 B)
267       (sha1-add-to-H H2 C)
268       (sha1-add-to-H H3 D)
269       (sha1-add-to-H H4 E))))
270
271 (defun sha1-binary (string)
272   "Return the SHA1 of STRING in binary form."
273   (let (;; prepare buffers for a block. byte-length of block is 64.
274         ;; input block is split into two vectors.
275         ;;
276         ;; input block: 00 01 02 03 04 05 06 07 08 09 0A 0B 0C 0D 0E 0F ...
277         ;; block-high:  +-0-+       +-1-+       +-2-+       +-3-+
278         ;; block-low:         +-0-+       +-1-+       +-2-+       +-3-+
279         ;;
280         ;; length of each vector is 80, and elements of each vector are
281         ;; 16bit integers.  elements 0x10-0x4F of each vector are
282         ;; assigned later in `sha1-block'.
283         (block-high (eval-when-compile (make-vector 80 nil)))
284         (block-low  (eval-when-compile (make-vector 80 nil))))
285     (unwind-protect
286         (let* (;; byte-length of input string.
287                (len (length string))
288                (lim (* (/ len 64) 64))
289                (rem (% len 4))
290                (idx 0)(pos 0))
291           ;; initialize buffers (H0 H1 H2 H3 H4).
292           (setq sha1-H0-high 26437      ; (string-to-number "6745" 16)
293                 sha1-H0-low  8961       ; (string-to-number "2301" 16)
294                 sha1-H1-high 61389      ; (string-to-number "EFCD" 16)
295                 sha1-H1-low  43913      ; (string-to-number "AB89" 16)
296                 sha1-H2-high 39098      ; (string-to-number "98BA" 16)
297                 sha1-H2-low  56574      ; (string-to-number "DCFE" 16)
298                 sha1-H3-high 4146       ; (string-to-number "1032" 16)
299                 sha1-H3-low  21622      ; (string-to-number "5476" 16)
300                 sha1-H4-high 50130      ; (string-to-number "C3D2" 16)
301                 sha1-H4-low  57840)     ; (string-to-number "E1F0" 16)
302           ;; loop for each 64 bytes block.
303           (while (< pos lim)
304             ;; step (a).
305             (setq idx 0)
306             (while (< idx 16)
307               (aset block-high idx (+ (* (aref string pos) 256)
308                                       (aref string (1+ pos))))
309               (setq pos (+ pos 2))
310               (aset block-low  idx (+ (* (aref string pos) 256)
311                                       (aref string (1+ pos))))
312               (setq pos (+ pos 2))
313               (setq idx (1+ idx)))
314             (sha1-block block-high block-low))
315           ;; last block.
316           (if (prog1
317                   (< (- len lim) 56)
318                 (setq lim (- len rem))
319                 (setq idx 0)
320                 (while (< pos lim)
321                   (aset block-high idx (+ (* (aref string pos) 256)
322                                           (aref string (1+ pos))))
323                   (setq pos (+ pos 2))
324                   (aset block-low  idx (+ (* (aref string pos) 256)
325                                           (aref string (1+ pos))))
326                   (setq pos (+ pos 2))
327                   (setq idx (1+ idx)))
328                 ;; this is the last (at most) 32bit word.
329                 (cond
330                  ((= rem 3)
331                   (aset block-high idx (+ (* (aref string pos) 256)
332                                           (aref string (1+ pos))))
333                   (setq pos (+ pos 2))
334                   (aset block-low  idx (+ (* (aref string pos) 256)
335                                           128)))
336                  ((= rem 2)
337                   (aset block-high idx (+ (* (aref string pos) 256)
338                                           (aref string (1+ pos))))
339                   (aset block-low  idx 32768))
340                  ((= rem 1)
341                   (aset block-high idx (+ (* (aref string pos) 256)
342                                           128))
343                   (aset block-low  idx 0))
344                  (t ;; (= rem 0)
345                   (aset block-high idx 32768)
346                   (aset block-low  idx 0)))
347                 (setq idx (1+ idx))
348                 (while (< idx 16)
349                   (aset block-high idx 0)
350                   (aset block-low  idx 0)
351                   (setq idx (1+ idx))))
352               ;; last block has enough room to write the length of string.
353               (progn
354                 ;; write bit length of string to last 4 bytes of the block.
355                 (aset block-low  15 (* (% len 8192) 8))
356                 (setq len (/ len 8192))
357                 (aset block-high 15 (% len 65536))
358                 ;; XXX: It is not practical to compute SHA1 of
359                 ;;      such a huge message on emacs.
360                 ;; (setq len (/ len 65536))     ; for 64bit emacs.
361                 ;; (aset block-low  14 (% len 65536))
362                 ;; (aset block-high 14 (/ len 65536))
363                 (sha1-block block-high block-low))
364             ;; need one more block.
365             (sha1-block block-high block-low)
366             (fillarray block-high 0)
367             (fillarray block-low  0)
368             ;; write bit length of string to last 4 bytes of the block.
369             (aset block-low  15 (* (% len 8192) 8))
370             (setq len (/ len 8192))
371             (aset block-high 15 (% len 65536))
372             ;; XXX: It is not practical to compute SHA1 of
373             ;;      such a huge message on emacs.
374             ;; (setq len (/ len 65536))         ; for 64bit emacs.
375             ;; (aset block-low  14 (% len 65536))
376             ;; (aset block-high 14 (/ len 65536))
377             (sha1-block block-high block-low))
378           ;; make output string (in binary form).
379           (let ((result (make-string 20 0)))
380             (aset result  0 (/ sha1-H0-high 256))
381             (aset result  1 (% sha1-H0-high 256))
382             (aset result  2 (/ sha1-H0-low  256))
383             (aset result  3 (% sha1-H0-low  256))
384             (aset result  4 (/ sha1-H1-high 256))
385             (aset result  5 (% sha1-H1-high 256))
386             (aset result  6 (/ sha1-H1-low  256))
387             (aset result  7 (% sha1-H1-low  256))
388             (aset result  8 (/ sha1-H2-high 256))
389             (aset result  9 (% sha1-H2-high 256))
390             (aset result 10 (/ sha1-H2-low  256))
391             (aset result 11 (% sha1-H2-low  256))
392             (aset result 12 (/ sha1-H3-high 256))
393             (aset result 13 (% sha1-H3-high 256))
394             (aset result 14 (/ sha1-H3-low  256))
395             (aset result 15 (% sha1-H3-low  256))
396             (aset result 16 (/ sha1-H4-high 256))
397             (aset result 17 (% sha1-H4-high 256))
398             (aset result 18 (/ sha1-H4-low  256))
399             (aset result 19 (% sha1-H4-low  256))
400             result))
401       ;; do not leave a copy of input string.
402       (fillarray block-high nil)
403       (fillarray block-low  nil))))
404
405 (defun sha1-string-internal (string)
406   (encode-hex-string (sha1-binary string)))
407
408 (defun sha1-region-internal (beg end)
409   (sha1-string-internal (buffer-substring-no-properties beg end)))
410
411 ;;;
412 ;;; application interface.
413 ;;;
414
415 (defun sha1-region (beg end)
416   (if (and sha1-use-external
417            sha1-maximum-internal-length
418            (> (abs (- end beg)) sha1-maximum-internal-length))
419       (sha1-region-external beg end)
420     (sha1-region-internal beg end)))
421
422 (defun sha1-string (string)
423   (if (and sha1-use-external
424            sha1-maximum-internal-length
425            (> (length string) sha1-maximum-internal-length))
426       (sha1-string-external string)
427     (sha1-string-internal string)))
428
429 ;;;###autoload
430 (defun sha1 (object &optional beg end)
431   "Return the SHA1 (Secure Hash Algorithm) of an object.
432 OBJECT is either a string or a buffer.
433 Optional arguments BEG and END denote buffer positions for computing the
434 hash of a portion of OBJECT."
435   (if (stringp object)
436       (sha1-string object)
437     (save-excursion
438       (set-buffer object)
439       (sha1-region (or beg (point-min)) (or end (point-max))))))
440
441 (provide 'sha1-el)
442
443 ;;; sha1-el.el ends here