【发布时间】:2011-06-04 20:03:50
【问题描述】:
我正在尝试使用 Haskell 解析二进制格式 (PES):
import qualified Data.ByteString.Lazy as BL
import Data.Word
import Data.Word.Word24
import qualified Data.ByteString.Lazy.Char8 as L8
data Stitch = MyCoord Int Int deriving (Eq, Show)
data PESFile = PESFile {
pecstart :: Word24
, width :: Int
, height :: Int
, numColors :: Int
, header :: String
, stitches :: [Stitch]
} deriving (Eq, Show)
readPES :: BL.ByteString -> Maybe PESFile
readPES bs =
let s = L8.drop 7 bs
pecstart = L8.readInt s in
case pecstart of
Nothing -> Nothing
Just (offset,rest) -> Just (PESFile offset 1 1 1 "#PES" [])
main = do
input <- BL.getContents
print $ readPES input
我需要读取 pecstart 以获取其他数据的偏移量(宽度、高度和针迹) 但这对我不起作用,因为我需要读取 24 位值,而 ByteString 包似乎没有 24 位版本。
我应该使用不同的方法吗? Data.Binary 包似乎适用于简单格式,但我不确定它如何用于这样的事情,因为您必须读取一个值才能找到文件中其他数据的偏移量。我错过了什么?
【问题讨论】:
-
你不会为
PESFile添加一个Binary的实例吗?二进制包看起来没问题,因为 put/get 函数是一系列操作(例如,您可以读取 pecstart 以获取下一位)。 -
我很想尝试这种方法 Jeff。我一直在研究关于二进制输入的 Real World Haskell 章节。如果有关于创建新二进制实例的教程,我很乐意试一试。
-
出于效率原因,您可能应该将标头保留为字节串。并且
MyCoord应该使用严格的Int字段(例如!Int)。 -
如果您要使用 24 位整数做大量工作,我建议您查看
word24包,hackage.haskell.org/package/word24。它提供了 24 位有符号和无符号整数,具有适当的边界、位移等。还有一个可存储的实例,但对于仅从字节串中读取一个值,我可能会使用 Don Stewart 的解决方案。
标签: haskell binary bytestring