/[cmucl]/src/code/extfmts.lisp
ViewVC logotype

Diff of /src/code/extfmts.lisp

Parent Directory Parent Directory | Revision Log Revision Log | View Patch Patch

revision 1.2.4.3 by rtoy, Mon Jun 23 15:03:31 2008 UTC revision 1.2.4.3.2.15 by rtoy, Thu Apr 23 18:04:36 2009 UTC
# Line 21  Line 21 
21  (defvar *external-formats* (make-hash-table :test 'equal))  (defvar *external-formats* (make-hash-table :test 'equal))
22  (defvar *external-format-aliases* (make-hash-table))  (defvar *external-format-aliases* (make-hash-table))
23    
24  (defconstant +ef-os+ 2)  (defconstant +ef-cin+ 2)
25  (defconstant +ef-so+ 3)  (defconstant +ef-cout+ 3)
26  (defconstant +ef-en+ 4)  (defconstant +ef-sin+ 4)
27  (defconstant +ef-de+ 5)  (defconstant +ef-sout+ 5)
28  (defconstant +ef-max+ 6)  (defconstant +ef-os+ 6)
29    (defconstant +ef-so+ 7)
30    (defconstant +ef-en+ 8)
31    (defconstant +ef-de+ 9)
32    (defconstant +ef-max+ 10)
33    
34  (define-condition external-format-not-implemented (error)  (define-condition external-format-not-implemented (error)
35    ()    ()
# Line 41  Line 45 
45  (defstruct efx  (defstruct efx
46    (octets-to-code #'%efni :type function :read-only t)    (octets-to-code #'%efni :type function :read-only t)
47    (code-to-octets #'%efni :type function :read-only t)    (code-to-octets #'%efni :type function :read-only t)
48    (cache nil :type (or null simple-vector)))    (cache nil :type (or null simple-vector))
49      (min 1 :type kernel:index :read-only t)
50      (max 1 :type kernel:index :read-only t))
51    
52  (defstruct (external-format  (defstruct (external-format
53               (:conc-name ef-)               (:conc-name ef-)
# Line 59  Line 65 
65    (print-unreadable-object (ef stream :type t :identity t)    (print-unreadable-object (ef stream :type t :identity t)
66      (princ (ef-name ef) stream)))      (princ (ef-name ef) stream)))
67    
68  (defun %whatsit (ef)  (defun %intern-ef (ef)
69    (setf (gethash (ef-name ef) *external-formats*) ef))    (setf (gethash (ef-name ef) *external-formats*) ef))
70    
71  (declaim (inline ef-octets-to-code ef-code-to-octets ef-cache))  (declaim (inline ef-octets-to-code ef-code-to-octets ef-cache
72                     ef-min-octets ef-max-octets))
73    
74  (defun ef-octets-to-code (ef)  (defun ef-octets-to-code (ef)
75    (efx-octets-to-code (ef-efx ef)))    (efx-octets-to-code (ef-efx ef)))
# Line 73  Line 80 
80  (defun ef-cache (ef)  (defun ef-cache (ef)
81    (efx-cache (ef-efx ef)))    (efx-cache (ef-efx ef)))
82    
83  (defmacro define-external-format (name octets-to-code code-to-octets)  (defun ef-min-octets (ef)
84    (let ((tmp1 (gensym)) (tmp2 (gensym)))    (efx-min (ef-efx ef)))
85    
86    (defun ef-max-octets (ef)
87      (efx-max (ef-efx ef)))
88    
89    (eval-when (:compile-toplevel :load-toplevel :execute)
90      (defun %merge-slots (old new)
91        (let* ((pos (length old))
92               (tmp (mapcar (lambda (x)
93                              (let* ((name (if (consp x) (first x) x))
94                                     (init (if (consp x) (second x) nil))
95                                     (list (if (consp x) (nthcdr 2 x) nil))
96                                     (prev (assoc name old))
97                                     (posn (if prev (second prev) (1- (incf pos)))))
98                                (list name posn init (getf list :type t))))
99                            new)))
100          (delete-duplicates (stable-sort (append old tmp) #'< :key #'second)
101                             :key #'second))))
102    
103    ;;; DEFINE-EXTERNAL-FORMAT  -- Public
104    ;;;
105    ;;; name (&key min max size) (&rest slots) octets-to-code code-to-octets
106    ;;;   Define a new external format.  Min/Max/Size are the minimum and
107    ;;;   maximum number of octets that make up a character (:size N is just
108    ;;;   shorthand for :min N :max N).  Slots is a list of slot descriptions
109    ;;;   similar to defstruct.
110    ;;;
111    ;;; name (base) (&rest slots)
112    ;;;   Define an external format based on a previously-defined external
113    ;;;   format, Base.  The slot names used in Slots must match those in Base.
114    ;;;
115    ;;; octets-to-code (state input unput &rest vars)
116    ;;;   Defines a form to be used by the external format to convert
117    ;;;   octets to a code point.  State is a form that can be used by the
118    ;;;   body to access the state variable of the stream.  Input is a
119    ;;;   form that can be used to read one more octets from the input
120    ;;;   strema.  Similarly, Unput is a form to put back one octet to the
121    ;;;   input stream.  Vars is a list of vars that need to be defined
122    ;;;   for any symbols used within the form.
123    ;;;
124    ;;;   This should return two values: the code and the number of octets
125    ;;;   read to form the code.
126    ;;;
127    ;;; code-to-octets (code state output &rest vars)
128    ;;;   Defines a form to be used by the external format to convert a
129    ;;;   code point to octets for output.  Code is the code point to be
130    ;;;   converted.  State is a form to access the current value of the
131    ;;;   stream's state variable.  Output is a form that writes one octet
132    ;;;   to the output stream.
133    ;;;
134    ;;; Note: external-formats work on code-points, not
135    ;;;   characters, so that the entire 31 bit ISO-10646 range can be
136    ;;;   used internally regardless of the size of a character recognized
137    ;;;   by Lisp and external formats can be useful to people who want to
138    ;;;   process characters outside the Lisp range (see
139    ;;;   CODEPOINT-TO-OCTETS, OCTETS-TO-CODEPOINT)
140    ;;;
141    (defmacro define-external-format (name (&rest args) (&rest slots)
142                                           &optional octets-to-code code-to-octets)
143      (when (and (oddp (length args)) (not (= (length args) 1)))
144        (warn "Nonsensical argument (~S) to DEFINE-EXTERNAL-FORMAT." args))
145      (let* ((tmp (gensym))
146             (min (if (evenp (length args))
147                      (or (getf args :min) (getf args :size) 1)
148                      1))
149             (max (if (evenp (length args))
150                      (or (getf args :max) (getf args :size) 6)
151                      6))
152             (base (if (= (length args) 1)
153                       (find-external-format (first args))
154                       nil))
155             (bslotd (if base (ef-slotd base) nil))
156             (slotd (%merge-slots bslotd slots))
157             (slotb (loop for slot in slotd
158                      collect `(,(first slot)
159                                `(the ,',(fourth slot)
160                                  ;; IDENTITY is here to protect against SETF
161                                  (identity (svref %slots% ,',(second slot))))))))
162      `(macrolet ((octets-to-code ((state input unput &rest vars) body)      `(macrolet ((octets-to-code ((state input unput &rest vars) body)
163                    `(lambda (,',tmp1 ,state ,input ,unput)                    `(lambda (,state ,input ,unput)
164                       (declare (ignore ,',tmp1)                       (declare (ignorable ,state ,input ,unput)
                               (ignorable ,state ,input ,unput)  
165                                (optimize (ext:inhibit-warnings 3)))                                (optimize (ext:inhibit-warnings 3)))
166                       (let ((,input `(the (or (unsigned-byte 8) null) ,,input))                       (let (,@',slotb
167                               (,input `(the (or (unsigned-byte 8) null) ,,input))
168                             ,@(loop for var in vars collect `(,var (gensym))))                             ,@(loop for var in vars collect `(,var (gensym))))
169                         ,body)))                         ,body)))
170                  (code-to-octets ((code state output &rest vars) body)                  (code-to-octets ((code state output &rest vars) body)
171                    `(lambda (,',tmp1 ,',tmp2 ,state ,output)                    `(lambda (,',tmp ,state ,output)
172                       (declare (ignore ,',tmp1)                       (declare (ignorable ,state ,output)
                               (ignorable ,state ,output)  
173                                (optimize (ext:inhibit-warnings 3)))                                (optimize (ext:inhibit-warnings 3)))
174                       (let ((,code ',code)                       (let (,@',slotb
175                               (,code ',code)
176                             ,@(loop for var in vars collect `(,var (gensym))))                             ,@(loop for var in vars collect `(,var (gensym))))
177                         `(let ((,',code (the (unsigned-byte 31) ,,',tmp2)))                         `(let ((,',code (the (unsigned-byte 31) ,,',tmp)))
178                            (declare (ignorable ,',code))                            (declare (ignorable ,',code))
179                            ,,body)))))                            ,,body)))))
180         (%whatsit (make-external-format ,name         (%intern-ef (make-external-format ,name
181                    (make-efx :octets-to-code ,octets-to-code                      ,(if base
182                              :code-to-octets ,code-to-octets                           `(ef-efx (find-external-format ,(ef-name base)))
183                              :cache (make-array +ef-max+ :initial-element nil))                           `(make-efx :octets-to-code ,octets-to-code
184                    nil                                      :code-to-octets ,code-to-octets
185                    #() '())))))                                      :cache (make-array +ef-max+
186                                                              :initial-element nil)
187  (defmacro define-composing-external-format (name input output)                                      :min ,(min min max) :max ,(max min max)))
188    (let ((tmp1 (gensym)) (tmp2 (gensym)))                      nil
189                        (vector ,@(mapcar #'third slotd))
190                        ',slotd)))))
191    
192    ;;; DEFINE-COMPOSING-EXTERNAL-FORMAT  -- Public
193    ;;;
194    ;;; A composing-external-format differs from an (ordinary) external-format
195    ;;; in that it translates characters (really codepoints, of course) into
196    ;;; other characters, rather than translating between characters and binary
197    ;;; octets.  They have to be composed with a non-composing external-format
198    ;;; to be of any use.
199    ;;;
200    (defmacro define-composing-external-format (name (&key min max size)
201                                                     input output)
202      (let ((tmp (gensym))
203            (min (or min size 1))
204            (max (or max size 1)))
205      `(macrolet ((input ((state input unput &rest vars) body)      `(macrolet ((input ((state input unput &rest vars) body)
206                    `(lambda (,',tmp1 ,state ,input ,unput)                    `(lambda (,state ,input ,unput)
207                       (declare (ignore ,',tmp1)                       (declare (ignorable ,state ,input ,unput)
                               (ignorable ,state ,input ,unput)  
208                                (optimize (ext:inhibit-warnings 3)))                                (optimize (ext:inhibit-warnings 3)))
209                       (let ((,input `(the (values (or (unsigned-byte 31) null)                       (let ((,input `(the (values (or (unsigned-byte 31) null)
210                                                   lisp::index)                                                   kernel:index)
211                                           ,,input))                                           ,,input))
212                             ,@(loop for var in vars collect `(,var (gensym))))                             ,@(loop for var in vars collect `(,var (gensym))))
213                         ,body)))                         ,body)))
214                  (output ((code state output &rest vars) body)                  (output ((code state output &rest vars) body)
215                    `(lambda (,',tmp1 ,',tmp2 ,state ,output)                    `(lambda (,',tmp ,state ,output)
216                       (declare (ignore ,',tmp1)                       (declare (ignorable ,state ,output)
                               (ignorable ,state ,output)  
217                                (optimize (ext:inhibit-warnings 3)))                                (optimize (ext:inhibit-warnings 3)))
218                       (let ((,code ',code)                       (let ((,code ',code)
219                             ,@(loop for var in vars collect `(,var (gensym))))                             ,@(loop for var in vars collect `(,var (gensym))))
220                         `(let ((,',code (the (unsigned-byte 31) ,,',tmp2)))                         `(let ((,',code (the (unsigned-byte 31) ,,',tmp)))
221                            (declare (ignorable ,',code))                            (declare (ignorable ,',code))
222                            ,,body)))))                            ,,body)))))
223         (%whatsit (make-external-format ,name         (%intern-ef (make-external-format ,name
224                    (make-efx :octets-to-code ,input                      (make-efx :octets-to-code ,input
225                              :code-to-octets ,output)                                :code-to-octets ,output
226                    t                                :min ,(min min max) :max ,(max min max))
227                    #() '())))))                      t
228                        #() '())))))
229    
230  (defun load-external-format-aliases ()  (defun load-external-format-aliases ()
231    (let ((*package* (find-package "KEYWORD")))    (let ((*package* (find-package "KEYWORD"))
232            (unix::*filename-encoding* :iso8859-1))
233      (with-open-file (stm "ext-formats:aliases" :if-does-not-exist nil)      (with-open-file (stm "ext-formats:aliases" :if-does-not-exist nil)
234        (when stm        (when stm
235          (do ((alias (read stm nil stm) (read stm nil stm))          (do ((alias (read stm nil stm) (read stm nil stm))
236               (value (read stm nil stm) (read stm nil stm)))               (value (read stm nil stm) (read stm nil stm)))
237              ((or (eq alias stm) (eq value stm))              ((or (eq alias stm) (eq value stm))
238               (unless (eq alias stm)               (unless (eq alias stm)
239                 (warn "External-format aliases file ends early.")))                 (warn "External-format aliases file ends early.")))
240            (if (and (keywordp alias) (keywordp value))            (if (and (keywordp alias) (keywordp value))
241                (setf (gethash alias *external-format-aliases*) value)                (setf (gethash alias *external-format-aliases*) value)
242                (warn "Bad entry in external-format aliases file: ~S => ~S."                (warn "Bad entry in external-format aliases file: ~S => ~S."
243                      alias value)))))))                      alias value)))))))
244    
245  (defun %find-external-format (name)  (defun %find-external-format (name)
246      ;; avoid loading files, etc., early in the boot sequence
247      (when (or (eq name :iso8859-1)
248                (and (eq name :default) (eq *default-external-format* :iso8859-1)))
249        (return-from %find-external-format
250          (gethash :iso8859-1 *external-formats*)))
251    
252    (when (zerop (hash-table-count *external-format-aliases*))    (when (zerop (hash-table-count *external-format-aliases*))
253      (setf (gethash :latin1 *external-format-aliases*) :iso8859-1)      (setf (gethash :latin1 *external-format-aliases*) :iso8859-1)
254      (setf (gethash :latin-1 *external-format-aliases*) :iso8859-1)      (setf (gethash :latin-1 *external-format-aliases*) :iso8859-1)
# Line 159  Line 265 
265    
266    (or (gethash name *external-formats*)    (or (gethash name *external-formats*)
267        (and (let ((*package* (find-package "STREAM"))        (and (let ((*package* (find-package "STREAM"))
268                   (lisp::*enable-package-locked-errors* nil))                   (lisp::*enable-package-locked-errors* nil)
269               (load (format nil "ext-formats:~(~A~)" name)                   (*default-external-format* :iso8859-1)
270                     :if-does-not-exist nil))                   (unix::*filename-encoding* :iso8859-1)
271                     (s (open (format nil "ext-formats:~(~A~).lisp" name) :if-does-not-exist nil)))
272                 (when s
273                   (null (nth-value 1 (ext:compile-from-stream s)))))
274             (gethash name *external-formats*))))             (gethash name *external-formats*))))
275    
276  (defun %composed-ef-name (a b)  (defun %composed-ef-name (a b)
277    (if (consp a) (append a (list b)) (list a b)))    (if (consp a) (append a (list b)) (list a b)))
278    
279  (defun %compose-external-formats (a b &optional name)  (defun %compose-external-formats (a b)
280    (when (ef-composingp a)    (when (ef-composingp a)
281      (error "~S is a Composing-External-Format." (ef-name a)))      (error "~S is a Composing-External-Format." (ef-name a)))
282    (unless (ef-composingp b)    (unless (ef-composingp b)
283      (error "~S is not a Composing-External-Format." (ef-name b)))      (error "~S is not a Composing-External-Format." (ef-name b)))
   (when name  
     (setf (getf name *external-format-aliases*)  
         (%composed-ef-name (ef-name a) (ef-name b))))  
284    (make-external-format    (make-external-format
285     (%composed-ef-name (ef-name a) (ef-name b))     (%composed-ef-name (ef-name a) (ef-name b))
286     (make-efx     (make-efx
287      :octets-to-code (lambda (tmp state input unput)      :octets-to-code (lambda (state input unput)
288                        (declare (ignore tmp))                        (funcall (ef-octets-to-code b) state
289                        (funcall (ef-octets-to-code b) (ef-slots b)                                 (funcall (ef-octets-to-code a)
290                                 state                                          state input unput)
                                (funcall (ef-octets-to-code a) (ef-slots a)  
                                         state  
                                         input  
                                         unput)  
291                                 unput))                                 unput))
292      :code-to-octets (lambda (tmp code state output)      :code-to-octets (lambda (code state output)
293                        (declare (ignore tmp))                        (funcall (ef-code-to-octets b) code state
                       (funcall (ef-code-to-octets b) (ef-slots b)  
                                code  
                                state  
294                                 `(lambda (x)                                 `(lambda (x)
295                                   ,(funcall (ef-code-to-octets a)                                   ,(funcall (ef-code-to-octets a)
                                            (ef-slots a)  
296                                             'x state output))))                                             'x state output))))
297      :cache (make-array +ef-max+ :initial-element nil))      :cache (make-array +ef-max+ :initial-element nil)
298        :min (* (ef-min-octets a) (ef-min-octets b))
299        :max (* (ef-max-octets a) (ef-max-octets b)))
300     nil #() '()))     nil #() '()))
301    
302  (defun find-external-format (name &optional (error-p t))  (defun find-external-format (name &optional (error-p t))
# Line 212  Line 312 
312    (when (and (consp name) (not (cdr name)))    (when (and (consp name) (not (cdr name)))
313      (setq name (car name)))      (setq name (car name)))
314    
315    (if (consp name)    (flet ((not-found ()
316        (let ((efs (mapcar #'%find-external-format name)))             (when (equal *default-external-format* name)
317          (if (member nil efs)               (setq *default-external-format* :iso8859-1))
318              (if error-p (error "External format ~S not found." name) nil)             (if error-p (error "External format ~S not found." name) nil)))
319              (let ((name (reduce #'%composed-ef-name (mapcar #'ef-name efs))))      (if (consp name)
320                (or (gethash name *external-formats*)          (let ((efs (mapcar #'%find-external-format name)))
321                    (%whatsit (reduce #'%compose-external-formats efs))))))            (if (member nil efs)
322        (or (%find-external-format name)                (not-found)
323            (if error-p (error "External format ~S not found." name) nil))))                (let ((name (reduce #'%composed-ef-name (mapcar #'ef-name efs))))
324                    (or (gethash name *external-formats*)
325                        (%intern-ef (reduce #'%compose-external-formats efs))))))
326            (or (%find-external-format name) (not-found)))))
327    
328    (defun flush-external-formats ()
329      (maphash (lambda (name ef)
330                 (declare (ignore name))
331                 (fill (ef-cache ef) nil))
332               *external-formats*))
333    
334    (defvar *.table-inverse.* (make-hash-table :test 'eq :size 7))
335    
336    (defun invert-table (table)
337      (declare (type (or (simple-array (unsigned-byte 31) *)
338                         (simple-array (unsigned-byte 16) *))
339                     table)
340               (optimize (speed 3) (space 0) (safety 0) (debug 0)
341                         (ext:inhibit-warnings 3)))
342      (or (gethash table *.table-inverse.*)
343          (let* ((result (make-hash-table))
344                 (width (array-dimension table 0))
345                 (power (1- (array-rank table)))
346                 (base (if (= width 94) 1 0)))
347            (assert (and (< power 3) (<= width 256)))
348            (dotimes (i (array-total-size table))
349              (declare (type (integer 0 (#.array-dimension-limit)) i))
350              (let ((tmp i) (val (row-major-aref table i)) (z 0))
351                (declare (type (integer 0 (#.array-dimension-limit)) tmp)
352                         (type (unsigned-byte 32) z))
353                (unless (or (= val #xFFFE) (gethash val result))
354                  (dotimes (j power)
355                    ;; j is only ever 0 in reality, since no n^3 tables are
356                    ;; defined; z was declared as 32-bit above, so that limits
357                    ;; us to 0 <= j <= 2   (see the ASSERT)
358                    (declare (type (integer 0 2) j))
359                    (multiple-value-bind (x y) (floor tmp width)
360                      (setq tmp x)
361                      (setq z (logior z (ash (the (integer 0 255) (+ y base))
362                                             (the (integer 0 24)
363                                               (* 8 (- power j))))))))
364                  (setf (gethash val result) (logior z (+ tmp base))))))
365            (setf (gethash table *.table-inverse.*) result))))
366    
367    
368  (define-condition void-external-format (error)  (define-condition void-external-format (error)
369    ()    ()
# Line 229  Line 372 
372        (declare (ignore condition))        (declare (ignore condition))
373        (format stream "Attempting I/O through void external-format."))))        (format stream "Attempting I/O through void external-format."))))
374    
375  (define-external-format :void  (define-external-format :void (:size 0) ()
376    (octets-to-code (state input unput)    (octets-to-code (state input unput)
377      `(error 'void-external-format))      `(error 'void-external-format))
378    (code-to-octets (code state output)    (code-to-octets (code state output)
379      `(error 'void-external-format)))      `(error 'void-external-format)))
380    
381  (define-external-format :iso8859-1  (define-external-format :iso8859-1 (:size 1) ()
382    (octets-to-code (state input unput)    (octets-to-code (state input unput)
383      `(values ,input 1))      `(values ,input 1))
384    (code-to-octets (code state output)    (code-to-octets (code state output)
385      `(,output (if (> ,code 255) #x3F ,code))))      `(,output (if (> ,code 255) #x3F ,code))))
386    
387    ;;; OCTETS-TO-CODEPOINT, CODEPOINT-TO-OCTETS  -- Semi-Public
388    ;;;
389    ;;; Normally you'd want to use OCTETS-TO-CHAR and CHAR-TO-OCTETS instead of
390    ;;; these, but that limits you to Lisp's idea of a character - either Latin-1
391    ;;; in 8 bit Lisp images, or the Unicode BMP in 16 bit images.  If you want
392    ;;; to read or write texts containing characters not supported by your Lisp,
393    ;;; these macros can be used instead.
394  (defmacro octets-to-codepoint (external-format state count input unput)  (defmacro octets-to-codepoint (external-format state count input unput)
395    (let ((tmp1 (gensym)) (tmp2 (gensym)))    (let ((tmp1 (gensym)) (tmp2 (gensym))
396      `(let ((body (funcall (ef-octets-to-code ,external-format)          (ef (find-external-format external-format)))
397                            (ef-slots ,external-format)      `(multiple-value-bind (,tmp1 ,tmp2)
398                            ',state ',input ',unput)))           ,(funcall (ef-octets-to-code ef) state input unput)
399         `(multiple-value-bind (,',tmp1 ,',tmp2) ,body         (setf ,count (the kernel:index ,tmp2))
400            (setf ,',count (the lisp::index ,',tmp2))         (the (or (unsigned-byte 31) null) ,tmp1))))
           (the (or (unsigned-byte 31) null) ,',tmp1)))))  
401    
402  (defmacro codepoint-to-octets (external-format code state output)  (defmacro codepoint-to-octets (external-format code state output)
403    `(funcall (ef-code-to-octets ,external-format) (ef-slots ,external-format)    (let ((ef (find-external-format external-format)))
404              ',code ',state ',output))      (funcall (ef-code-to-octets ef) code state output)))
405    
406    
407    
# Line 268  Line 417 
417            (adjust-array (ef-cache ef) (+ base reqd) :initial-element nil)))            (adjust-array (ef-cache ef) (+ base reqd) :initial-element nil)))
418      base))      base))
419    
420    ;;; DEF-EF-MACRO  -- Public
421    ;;;
422    ;;;
423  (defmacro def-ef-macro (name (ef id reqd idx) body)  (defmacro def-ef-macro (name (ef id reqd idx) body)
424    (let ((tmp (gensym)))    (let ((tmp1 (gensym))
425      `(defun ,name (,ef)          (tmp2 (gensym))
426         (let ((,tmp ,(if (eq id 'lisp::lisp)          (%name (intern (format nil "%~A" name) (symbol-package name))))
427                          idx      `(progn
428                          `(+ (ensure-cache ,ef ',id ,reqd) ,idx))))         (defun ,%name (,ef)
429           (or (aref (ef-cache ,ef) ,tmp)           (let* ((,tmp1 (find-external-format ,ef))
430               (setf (aref (ef-cache ,ef) ,tmp)                  (,tmp2 ,(if (eq id 'lisp::lisp)
431                   (let ((*compile-print* nil)) (compile nil ,body))))))))                              idx
432                                `(+ (ensure-cache ,tmp1 ',id ,reqd) ,idx))))
433               (funcall (or (aref (ef-cache ,tmp1) ,tmp2)
434                            (setf (aref (ef-cache ,tmp1) ,tmp2)
435                                (let ((*compile-print* nil)
436                                      ;; Set default format when we compile so we
437                                      ;; can see compiler messages.  if we don't,
438                                      ;; we run into a problem that we might be
439                                      ;; changing the default format while we're
440                                      ;; compiling, and we don't know how to output
441                                      ;; the compiler messages.
442                                      (*default-external-format* :iso8859-1))
443                                  (compile nil `(lambda (%slots%)
444                                                  (declare (ignorable %slots%))
445                                                  ,,body)))))
446                        (ef-slots ,tmp1))))
447           (declaim (inline ,name))
448           (defun ,name (,tmp1)
449             (let ((,tmp2 (load-time-value (cons nil nil))))
450               (when (eq ,tmp1 :default)
451                 (setq ,tmp1 *default-external-format*))
452               (if (eq ,tmp1 (car ,tmp2))
453                   (cdr ,tmp2)
454                   (setf (car ,tmp2) ,tmp1
455                         (cdr ,tmp2) (,%name ,tmp1))))))))
456    
457    
458    
459    ;;; OCTETS-TO-CHAR, CHAR-TO-OCTETS  -- Public
460    ;;;
461    ;;; Read and write one character through an external-format
462    ;;;
463  (defmacro octets-to-char (external-format state count input unput)  (defmacro octets-to-char (external-format state count input unput)
464    `(let ((body (octets-to-codepoint ,external-format    (let ((s (gensym "STATE-")))
465                                      ,state ,count ,input ,unput)))      `(let ((,s ,state))
466       `(let ((code ,body))         (when (null ,s)
467          (declare (type (unsigned-byte 31) code))           ;; Need our own state variable to hold our state and the
468          (if (< code char-code-limit) (code-char code) #\?))))           ;; state for the external format.
469             (setq ,s (setf ,state (cons nil nil))))
470           (if (car ,s)
471               ;; Return the trailing surrgate.  Must set count to 0 to
472               ;; tell the stream code we didn't consume any octets!
473               (prog1 (the character (car ,s))
474                 (setf (car ,s) nil)
475                 (setf ,count 0))
476               (let ((code (octets-to-codepoint ,external-format
477                                                (cdr ,s) ,count ,input ,unput)))
478                 (declare (type (unsigned-byte 31) code))
479                 (cond ((or (<= #xD800 code #xDFFF)
480                            (> code #x10FFFF))
481                        #-(and unicode (not unicode-bootstrap)) #\?
482                        #+(and unicode (not unicode-bootstrap)) #\U+FFFD)
483                       #+unicode
484                       ((> code #xFFFF)
485                        (multiple-value-bind (hi lo)
486                            (lisp::surrogates code)
487                          (setf (car ,state) lo)
488                          hi))
489                       (t (code-char code))))))))
490    
491    ;; This doesn't handle surrogate code units correctly.  It just
492    ;; outputs the surrogate value to the external format.  External
493    ;; formats almost never allow surrogate code points (except UTF-16).
494  (defmacro char-to-octets (external-format char state output)  (defmacro char-to-octets (external-format char state output)
495    `(codepoint-to-octets ,external-format (char-code ,char) ,state ,output))    `(codepoint-to-octets ,external-format (char-code ,char) ,state ,output))
496    
497    
498  (def-ef-macro ef-string-to-octets (extfmt lisp::lisp +ef-max+ +ef-so+)  (def-ef-macro ef-string-to-octets (extfmt lisp::lisp +ef-max+ +ef-so+)
499    `(lambda (string start end buffer &aux (ptr 0) (state nil))    `(lambda (string start end buffer &aux (ptr 0) (state nil) (code 0))
500       (declare #|(optimize (speed 3) (safety 0) (space 0) (debug 0))|#       (declare #|(optimize (speed 3) (safety 0) (space 0) (debug 0))|#
501                (type simple-string string)                (type simple-string string)
502                (type lisp::index start end ptr)                (type kernel:index start end ptr)
503                (type (simple-array (unsigned-byte 8) (*)) buffer)                (type (simple-array (unsigned-byte 8) (*)) buffer)
504                  (type (integer 0 #x10ffff) code)
505                (ignorable state))                (ignorable state))
506       (dotimes (i (- end start) (values buffer ptr))      (loop with i of-type kernel_index = start
507         (declare (type lisp::index i))            while (< i end)
508         ,(char-to-octets extfmt (schar string (+ start i)) state            do
509                          (lambda (b)            (multiple-value-bind (c step)
510                            (when (= ptr (length buffer))                (lisp::codepoint string i end)
511                              (setq buffer (adjust-array buffer (* 2 ptr))))              (setf code c)
512                            (setf (aref buffer (1- (incf ptr))) b))))))              (incf i (if step 2 1))
513                (codepoint-to-octets ,extfmt code state
514                                     (lambda (b)
515                                       (when (= ptr (length buffer))
516                                         (setq buffer (adjust-array buffer (* 2 ptr))))
517                                       (setf (aref buffer (1- (incf ptr))) b)))))))
518    
519  (defun string-to-octets (string &key (start 0) end (external-format :default)  (defun string-to-octets (string &key (start 0) end (external-format :default)
520                                       (buffer nil bufferp))                                       (buffer nil bufferp))
521    (declare (type string string)    (declare (type string string)
522             (type lisp::index start)             (type kernel:index start)
523             (type (or lisp::index null) end)             (type (or kernel:index null) end)
524             (type (or (simple-array (unsigned-byte 8) (*)) null) buffer))             (type (or (simple-array (unsigned-byte 8) (*)) null) buffer))
525    (multiple-value-bind (buffer ptr)    (let* ((buffer (or buffer (make-array (length string)
       (lisp::with-array-data ((string string) (start start) (end end))  
         (funcall (ef-string-to-octets (find-external-format external-format))  
                  string start end  
                  (or buffer (make-array (length string)  
526                                          :element-type '(unsigned-byte 8)))))                                          :element-type '(unsigned-byte 8)))))
527      (values (if bufferp buffer (lisp::shrink-vector buffer ptr)) ptr)))      (multiple-value-bind (buffer ptr)
528            (lisp::with-array-data ((string string) (start start) (end end))
529              (funcall (ef-string-to-octets external-format)
530                       string start end buffer))
531          (values (if bufferp buffer (lisp::shrink-vector buffer ptr)) ptr))))
532    
533  (def-ef-macro ef-octets-to-string (extfmt lisp::lisp +ef-max+ +ef-os+)  (def-ef-macro ef-octets-to-string (extfmt lisp::lisp +ef-max+ +ef-os+)
534    `(lambda (octets ptr end string &aux (pos -1) (count 0) (state nil))    `(lambda (octets ptr end string &aux (pos -1) (count 0) (state nil) (code 0))
535       (declare #|(optimize (speed 3) (safety 0) (space 0) (debug 0))|#       (declare #|(optimize (speed 3) (safety 0) (space 0) (debug 0))|#
536                (type (simple-array (unsigned-byte 8) (*)) octets)                (type (simple-array (unsigned-byte 8) (*)) octets)
537                (type lisp::index end count)                (type kernel:index end count)
538                (type (integer -1 (#.array-dimension-limit)) ptr pos)                (type (integer -1 (#.array-dimension-limit)) ptr pos)
539                (type simple-string string)                (type simple-string string)
540                  (type (integer 0 #x10ffff) code)
541                (ignorable state))                (ignorable state))
542       (loop until (>= ptr end)       (loop until (>= ptr end)
543          do (when (= pos (length string))          do (when (= pos (length string))
544               (setq string (adjust-array string (* 2 pos))))               (setq string (adjust-array string (* 2 pos))))
545             (setf (schar string (incf pos))             (setf code
546                 ,(octets-to-char extfmt state count                 (octets-to-codepoint ,extfmt state count
547                                  (aref octets (incf ptr)) ;;@@ EOF??                                 (aref octets (incf ptr)) ;;@@ EOF??
548                                  (lambda (n) (decf ptr n))))                                 (lambda (n) (decf ptr n))))
549               ;; Convert codepoint to UTF-16 surrogate pairs if needed
550               (multiple-value-bind (high low)
551                   (surrogates code)
552                 (setf (aref string (incf pos)) high)
553                 (when low
554                   (setf (aref string (incf pos)) low)))
555          finally (return (values string (1+ pos))))))          finally (return (values string (1+ pos))))))
556    
557  (defun octets-to-string (octets &key (start 0) end (external-format :default)  (defun octets-to-string (octets &key (start 0) end (external-format :default)
558                                       (string nil stringp))                                       (string nil stringp))
559    (declare (type (simple-array (unsigned-byte 8) (*)) octets)    (declare (type (simple-array (unsigned-byte 8) (*)) octets)
560             (type lisp::index start)             (type kernel:index start)
561             (type (or lisp::index null) end)             (type (or kernel:index null) end)
562             (type (or simple-string null) string))             (type (or simple-string null) string))
563    (multiple-value-bind (string pos)    (multiple-value-bind (string pos)
564        (funcall (ef-octets-to-string (find-external-format external-format))        (funcall (ef-octets-to-string external-format)
565                 octets (1- start) (1- (or end (length octets)))                 octets (1- start) (1- (or end (length octets)))
566                 (or string (make-string (length octets))))                 (or string (make-string (length octets))))
567      (values (if stringp string (lisp::shrink-vector string pos)) pos)))      (values (if stringp string (lisp::shrink-vector string pos)) pos)))
# Line 354  Line 572 
572    `(lambda (string start end result &aux (ptr 0) (state nil))    `(lambda (string start end result &aux (ptr 0) (state nil))
573       (declare #|(optimize (speed 3) (safety 0) (space 0) (debug 0))|#       (declare #|(optimize (speed 3) (safety 0) (space 0) (debug 0))|#
574                (type simple-string string)                (type simple-string string)
575                (type lisp::index start end ptr)                (type kernel:index start end ptr)
576                (type simple-base-string result)                (type simple-base-string result)
577                (ignorable state))                (ignorable state))
578       (dotimes (i (- end start) (values result ptr))       (dotimes (i (- end start) (values result ptr))
579         (declare (type lisp::index i))         (declare (type kernel:index i))
580         ,(char-to-octets extfmt (schar string (+ start i)) state         (char-to-octets ,extfmt (schar string (+ start i)) state
581                          (lambda (b)                         (lambda (b)
582                            (when (= ptr (length result))                           (when (= ptr (length result))
583                              (setq result (adjust-array result (* 2 ptr))))                             (setq result (adjust-array result (* 2 ptr))))
584                            (setf (aref result (1- (incf ptr)))                           (setf (aref result (1- (incf ptr)))
585                                (code-char b)))))))                               (code-char b)))))))
586    
587  (defun string-encode (string external-format &optional (start 0) end)  (defun string-encode (string external-format &optional (start 0) end)
588      (when (zerop (length string))
589        (return-from string-encode string))
590    (multiple-value-bind (result ptr)    (multiple-value-bind (result ptr)
591        (lisp::with-array-data ((string string) (start start) (end end))        (lisp::with-array-data ((string string) (start start) (end end))
592          (funcall (ef-encode (find-external-format external-format))          (funcall (ef-encode external-format) string start end
                  string start end  
593                   (make-string (length string) :element-type 'base-char)))                   (make-string (length string) :element-type 'base-char)))
594      (lisp::shrink-vector result ptr)))      (lisp::shrink-vector result ptr)))
595    
# Line 378  Line 597 
597    `(lambda (string ptr end result &aux (pos -1) (count 0) (state nil))    `(lambda (string ptr end result &aux (pos -1) (count 0) (state nil))
598       (declare #|(optimize (speed 3) (safety 0) (space 0) (debug 0))|#       (declare #|(optimize (speed 3) (safety 0) (space 0) (debug 0))|#
599                (type simple-string string)                (type simple-string string)
600                (type lisp::index end count)                (type kernel:index end count)
601                (type (integer -1 (#.array-dimension-limit)) ptr pos)                (type (integer -1 (#.array-dimension-limit)) ptr pos)
602                (type simple-string result)                (type simple-string result)
603                (ignorable state))                (ignorable state))
# Line 386  Line 605 
605          ;; increasing size of result shouldn't ever be necessary, unless          ;; increasing size of result shouldn't ever be necessary, unless
606          ;; someone implements an encoding smaller than the source string...          ;; someone implements an encoding smaller than the source string...
607          do (setf (schar result (incf pos))          do (setf (schar result (incf pos))
608                 ,(octets-to-char extfmt state count                 (octets-to-char ,extfmt state count
609                                  ;; note the need to return NIL for EOF                                 ;; note the need to return NIL for EOF
610                                  (if (= (1+ ptr) (length string))                                 (if (= (1+ ptr) (length string))
611                                      nil                                     nil
612                                      (char-code (char string (incf ptr))))                                     (char-code (char string (incf ptr))))
613                                  (lambda (n) (decf ptr n))))                                 (lambda (n) (decf ptr n))))
614          finally (return (values result (1+ pos))))))          finally (return (values result (1+ pos))))))
615    
616  (defun string-decode (string external-format &optional (start 0) end)  (defun string-decode (string external-format &optional (start 0) end)
617      (when (zerop (length string))
618        (return-from string-decode string))
619    (multiple-value-bind (result pos)    (multiple-value-bind (result pos)
620        (lisp::with-array-data ((string string) (start start) (end end))        (lisp::with-array-data ((string string) (start start) (end end))
621          (funcall (ef-decode (find-external-format external-format))          (funcall (ef-decode external-format)
622                   string (1- start) (1- end) (make-string (length string))))                   string (1- start) (1- end) (make-string (length string))))
623      (lisp::shrink-vector result pos)))      (lisp::shrink-vector result pos)))

Legend:
Removed from v.1.2.4.3  
changed lines
  Added in v.1.2.4.3.2.15

  ViewVC Help
Powered by ViewVC 1.1.5