RetroBBS - comp.lang.misc - Re: Code gen

Re: Code gen - calling sequences

<sgg0ol$che$1@dont-email.me>

https://www.rocksolidbbs.com/devel/article-flat.php?id=596&group=comp.lang.misc#596

Path: i2pn2.org!i2pn.org!eternal-september.org!reader02.eternal-september.org!.POSTED!not-for-mail
From: bc@freeuk.com (Bart)
Newsgroups: comp.lang.misc
Subject: Re: Code gen - calling sequences
Date: Sun, 29 Aug 2021 14:06:27 +0100
Organization: A noiseless patient Spider
Lines: 63
Message-ID: <sgg0ol$che$1@dont-email.me>
References: <sg3a2l$dqb$1@dont-email.me> <sg9eo0$1os5$2@gioia.aioe.org>
<sgaut4$rij$1@dont-email.me> <sgbgm9$9l7$1@dont-email.me>
<sgdnqs$bd2$1@dont-email.me> <sgeiom$5jg$1@dont-email.me>
<sgfu91$qdg$1@z-news.wcss.wroc.pl>
Mime-Version: 1.0
Content-Type: text/plain; charset=utf-8; format=flowed
Content-Transfer-Encoding: 7bit
Injection-Date: Sun, 29 Aug 2021 13:06:29 -0000 (UTC)
Injection-Info: reader02.eternal-september.org; posting-host="7fc5023b536d3ef58b0d98a2b34c015f";
logging-data="12846"; mail-complaints-to="abuse@eternal-september.org"; posting-account="U2FsdGVkX19C4y+Ej+Gy90eyRccht4IcvGWA5Jaa23Q="
User-Agent: Mozilla/5.0 (Windows NT 6.1; Win64; x64; rv:78.0) Gecko/20100101
Thunderbird/78.11.0
Cancel-Lock: sha1:eAhyyqC6IqN0/o/y8JVulhmChYA=
In-Reply-To: <sgfu91$qdg$1@z-news.wcss.wroc.pl>
X-Antivirus-Status: Clean
Content-Language: en-GB
X-Antivirus: AVG (VPS 210829-4, 29/8/2021), Outbound message

by: Bart - Sun, 29 Aug 2021 13:06 UTC

On 29/08/2021 13:24, antispam@math.uni.wroc.pl wrote:
> Bart <bc@freeuk.com> wrote:

>> A rule of thumb I've sometimes observed is that, for x64 anyway, 1 line
>> of source code maps to about 10 bytes of binary machine code.
>
> Depends on the language. For C it may be lower, for some other
> languages much higher.
>
>> So 10 million lines of code represents a single 100MB program,
>> approximately.
>
> I work on a program when executable is 64 M. However, significant
> part of executable code is in loadable modules that take another
> 64 M. Guess how big is the source?

By my metric it would be about 6M lines of source code, if most of the
64KB was executable x64 code (rather than initialised data, embedded
data files, or other exe overheads).

That assumes a certain proportion of declaration lines to lines of
executable code.

Now you're going to tell me it's either a lot fewer or a lot more.

If the language is C, then I guess that could be anything: you can have
macros that expand to many times there size, and instantiated at
multiple sites; include files that can do the same trick. Or lot of
boilerplate code that reduces to nothing.

Or there is lots of inlining that pushes the size the other way again.

>> And it might be faster than you think: on a decent machine, unoptimised
>> code (or mildly optimised like mine) can probably be generated at
>> 5-10MB/second, using a single core. So there is plenty of capacity to do
>> interprocedural optimisation without it taking forever.
>
> Well, there is also issue of memory size. SmartEiffel used (uses???)
> whole-program optimization and compiled very fast. But for really
> large program it used to run out of memory. I am not sure if this is
> still problem on modern machines, but resonable estimate is that keeping
> all needed info in memory you may need 1000 times of memory as for source.
> So you need to carefully optimize space use...

3 compilers of mine I've just tested use memory equivalent to 15x (C
compiler), 20x (Interpreter), and 80x (my systems language) the source size.

But they all use persistent data structures, especially the last which
creates arrays of tokens, a bad idea I've since dropped. All those
include the source itself.

All the memory is recovered on program termination. If it becomes an
issue, then unneeded data structured can be destroyed earlier.

But if we say 40x source size, then capacity of 8GB means /currently/
being able to deal with source code of something over 10M lines,
depending one code density.

It just means being more resourceful, and reintroducing long-forgotten
techniques of working with memory-limited hardware.

ATM, 10M lines is 200 times the size of my typical projects.

Re: Code gen - calling sequences

<sgg13d$hck$2@gioia.aioe.org>

Subject	Author
Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	Rod Pemberton
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	Dmitry A. Kazakov
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	Dmitry A. Kazakov
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	Dmitry A. Kazakov
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	Dmitry A. Kazakov
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	Dmitry A. Kazakov
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	antispam
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	Rod Pemberton
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	Dmitry A. Kazakov
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	Rod Pemberton
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	Andy Walker
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	Dmitry A. Kazakov
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	Dmitry A. Kazakov
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	Dmitry A. Kazakov
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	Dmitry A. Kazakov
Re: Code gen - calling sequences	David Brown
Re: Code gen - calling sequences	James Harris
Re: Code gen - calling sequences	antispam
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	antispam
Re: Code gen - calling sequences	Bart
Re: Code gen - calling sequences	Rod Pemberton

Single tasking: Just Say No.

devel / comp.lang.misc / Re: Code gen - calling sequences

devel / comp.lang.misc / Re: Code gen - calling sequences